[:en]Project led by MAS pioneer in astronomical data analysis[:es]Proyecto liderado desde el MAS es pionero en el análisis de datos astronómicos[:]

[:en][fusion_text]

Currently, it is one of the more significant, ambitious projects in the Millennium Institute of Astrophysics MAS. It is called ALeRCE or Automatic Learning for the Rapid Classification of Events, which is known as “broker” in technical terms, and it seeks to create tools to fill the necessities of the new astronomy, characterized by a massive amount of data to analyze every observation night.

The construction of new astronomical observation instruments as the Large Synoptic Survey Telescope (LSST) -operative in 2022- it was not only great news for this science but also an enormous challenge to those who work on the astronomy field. How would it be possible to analyze the amount of data these new telescopes would give every night? In light of this situation, and before these instruments see the light, the community had to get ready, and the interdisciplinary nature becomes more relevant than ever.

Under this situation, it was born ALeRCE (acronym that reads for Automatic Learning for the Rapid Classification of Events), initiative led by researchers of the Millennium Institute of Astrophysics MAS, in which takes part a multidisciplinary team of scientists -between astronomers and engineers- of Universidad de Chile, Universidad Austral, Universidad Católica, Universidad de Concepción, Universidad Andrés Bello, Universidad Adolfo Ibañez, REUNA, and the international researchers collaboration of Caltech, Harvard, and the Washington University.

Basically, the work they do is the construction of tools and algorithms that allow the automatic analysis of data coming from the large telescopes to identify the most exciting astronomical objects in real-time, to then study them with other telescopes in tracking campaigns. A mission that one astronomer is incapable of doing by hand.
“In the new era of great surveys, it is necessary to identify and classify large amounts of transient and variable objects to classify them. The faster and exact the classification, the better the science to do. The selection mentioned above will be carried out by the astronomical brokers. Leading a broker from Chile will allow us to use better the tracking resources available, and also to develop the abilities needed in our community to be competitive, when telescopes such as LSST start to run in our country,” Francisco Förster states, MAS Associated Researcher, and also one of the ALeRCE leaders.

How does it work?

For now, ALeRCE has focused on three astronomical objects: supernovae, variable stars, and Active Galaxies Nuclei or AGN. However, it is intended to approach other subjects of study in the future. “We are interested in classifying every type of astronomical object, but as a way to start, we defined a simplified taxonomy to move forward. As the project progresses, we will make this taxonomy grow to cover new types of objects and new science. For this to happen, it is crucial to listen to the potential users of ALeRCE to understand what are their needs, and what kind of objects we should include in our taxonomy,” continues Förster, who also is a member of the Center of Mathematical Modeling of Universidad de Chile.

According to Förster, ALeRCE’s work start when a survey telescope such as the Zwicky Transient Facility (ZTF), or the LSST in the future, sends alerts that reach the system. Such system uses images linked to candidates to classify them as supernovae, AGN, variable stars, or asteroids using Deep Learning techniques. If there is a high probability, these candidates are published in several tools. In the case of supernovae, for instance, there is a tool called SN hunter (https://snhunter.alerce.online/) analyzed by one person and reported to the Transient Name Server, which is the official mechanism of the International Astronomical Union to report new transient objects. Currently, there are 1000 objects already reported as supernovae from the SN Hunter by ALeRCE, and 100 spectroscopically confirmed.

“Typically, we take 7 hours to report a new candidate, whereas other groups take more than 5 days since the first detection. On the other hand, we extract relevant parameters from the candidate, such as the flux difference reported, filter, or detection time to include them in our light curves database in the corresponding associated object. The flux difference becomes in an apparent flux considering the brightness of the guiding star, in the case that the candidate match with a stellar object, and we also calculate relevant features of the time-series flux using a FATS library modification. With this information, we use a classifier called random forest to classify the object among 15 different types (hierarchically grouped) that can be seen in our main explorer https://alerce.online/,” the astronomer explains.

Image Credit: lsst.org[/fusion_text][tagline_box backgroundcolor=”” shadow=”no” shadowopacity=”0.7″ border=”1px” bordercolor=”” highlightposition=”top” content_alignment=”left” link=”” linktarget=”_self” modal=”” button_size=”” button_shape=”” button_type=”” buttoncolor=”” button=”” title=”” description=”” margin_top=”” margin_bottom=”” animation_type=”0″ animation_direction=”down” animation_speed=”0.1″ animation_offset=”” class=”” id=””]

Recently, ALeRCE awarded a QUIMAL Fund for the Development of National Astronomy Instruments and Technology of the National Commission for Science and Technology, Conicyt, which will allow the building of a hybrid infrastructure given by the National University Network REUNA, and another one through Amazon Cloud, being able to have a broader capacity and redundancy of the massive amount of data received per night. According to Francisco Förster, MAS Associated Researcher, and leader of ALeRCE “this will give us a local copy of the most relevant data, and thus win at redundance in the case of failure, savings in computing costs (for example, to carry out an analysis of every data), higher speed to have access to data for the entire national community using REUNA, greater independence from the cloud service provider, and we will be able to train ourselves to handle hybrid infrastructures which will become more common in the future”

[/tagline_box][:es][fusion_text]

Es uno de los proyectos más grandes y ambiciosos ejecutados actualmente dentro del Instituto Milenio de Astrofísica MAS. Se trata de ALeRCE o Automatic Learning for the Rapid Classification of Events lo que en términos técnicos se conoce como “broker” y lo que busca es crear las herramientas para responder a las necesidades de la nueva astronomía, caracterizada por una cantidad ingente de datos para analizar cada noche de observación.

La construcción de nuevos instrumentos de observación astronómica como el Large Synoptic Survey Telescope (LSST) – que estará operativo en 2022- no sólo implicó una excelente noticia para esta ciencia, sino sobre todo un inmenso desafío para quienes se dedican a la astronomía. ¿Cómo sería posible analizar la cantidad de datos que estos nuevos telescopios entregarían cada noche? En este panorama, y antes que estos instrumentos estén terminados, la comunidad debió comenzar a prepararse y la interdisciplinariedad tomó más relevancia que nunca.

Es en este escenario que nació ALeRCE, sigla para Automatic Learning for the Rapid Classification of Events, una iniciativa liderada por investigadores del Instituto Milenio de Astrofísica MAS, en la que participa un equipo multidisciplinario de científicos y científicas – entre astrónomos e ingenieros – de la Universidad de Chile, la Universidad Austral, la Universidad Católica, la de Concepción, la Universidad Andrés Bello, la Universidad Adolfo Ibáñez, REUNA y la colaboración internacional de investigadores de Caltech, Harvard y la Universidad de Washington.

El trabajo que realizan básicamente es la construcción de herramientas y algoritmos que permitan el análisis automatizado de los datos provenientes de los grandes telescopios con el fin de poder identificar los objetos astronómicos más interesantes en tiempo real y con ello permitir que estos puedan luego ser estudiados con otros telescopios en campañas de seguimiento, una tarea que un astrónomo sería incapaz de hacer manualmente.
“En la nueva era de grandes surveys es necesario poder identificar y clasificar grandes volúmenes de objetos transientes y variables para su caracterización. Mientras más rápida y precisa la clasificación, mejor será la ciencia posible de hacer. La clasificación anterior la harán los llamados brokers astronómicos. Liderar un broker desde Chile nos permitirá ocupar de mejor forma los recursos de seguimiento disponibles y desarrollar las capacidades necesarias para que nuestra comunidad sea competitiva cuando telescopios como LSST comiencen a operar desde nuestro país”, asegura Francisco Förster, investigador asociado del MAS y uno de los líderes de ALeRCE.

Cómo funciona

Por ahora, ALeRCE se ha centrado en tres objetos astronómicos: supernovas, estrellas variables y núcleos activos de galaxias (AGN, por sus siglas en inglés). Sin embargo, en el futuro se pretende expandir a otros sujetos de estudio. “Nos interesa poder clasificar todo tipo de objetos astronómicos, pero en un comienzo definimos una taxonomía simplificada para poder avanzar. A medida que el proyecto evolucione haremos crecer esta taxonomía para abarcar nuevos tipos de objetos y nueva ciencia. Para esto es fundamental escuchar a los potenciales usuarios de ALeRCE, para entender cuáles son sus necesidades y qué tipos de objetos deberíamos incluir en nuestra taxonomía”, señala Förster, quien también pertenece al Centro de Modelamiento Matemático de la Universidad de Chile.

Según explica, el trabajo de ALeRCE comienza cuando un telescopio de levantamiento como el Zwicky Transient Facility (ZTF), o en el futuro el LSST, envía alertas que llegan al sistema, el que utiliza imágenes asociadas a candidatos para determinar, usando técnicas de aprendizaje profundo o Deep learning, la probabilidad de que sea una supernova, un AGN, una estrella variable o un asteroide. Si existe una alta probabilidad, estos candidatos se publican en distintas herramientas. En el caso de las supernovas, por ejemplo, va a una herramienta propia llamada SN hunter (https://snhunter.alerce.online/) para ser inspeccionada por una persona y reportada en el Transient Name Server, mecanismo oficial de la Unión Astronómica Internacional para reportar nuevos objetos transientes. Actualmente hay 1000 objetos reportados como supernovas desde el SN Hunter de ALeRCE y 100 confirmados espectroscópicamente.

“Típicamente nos demoramos 7 horas en reportar un nuevo candidato, mientras que otros grupos demoran más de 5 días desde la primera detección. En paralelo, al candidato se le extraen parámetros relevantes como la diferencia de flujo reportada, filtro, o tiempo de detección, para ser insertados en nuestra base de datos de curvas de luz en el objeto asociado correspondiente. La diferencia de flujo se convierte en un flujo aparente tomando en cuenta el brillo de la estrella de referencia, en caso que el candidato sea coincidente con un objeto estelar, y a la serie de tiempo de flujos se le calculan características relevantes usando una modificación de la librería FATS. Con esta información se utiliza un clasificador del tipo llamado random forest para clasificar el objeto entre 15 diferentes clases (agrupadas de forma jerárquica) que pueden ser visualizadas en nuestro explorador principal https://alerce.online/”, explica el astrónomo.

Crédito imagen: lsst.org

[/fusion_text][tagline_box backgroundcolor=”” shadow=”no” shadowopacity=”0.7″ border=”1px” bordercolor=”” highlightposition=”top” content_alignment=”left” link=”” linktarget=”_self” modal=”” button_size=”” button_shape=”” button_type=”” buttoncolor=”” button=”” title=”” description=”” margin_top=”” margin_bottom=”” animation_type=”0″ animation_direction=”down” animation_speed=”0.1″ animation_offset=”” class=”” id=””]

Recientemente ALeRCE se adjudicó un Fondo Astronomía QUIMAL para el Desarrollo de Tecnologías de la Astronomía Nacional, de la Comisión Nacional de Investigación Científica y Tecnológica, Conicyt, lo que le permitirá la construcción de una infraestructura híbrida proporcionada en una parte por la Red Académica de Chile, REUNA y otra en la nube a través de Amazon, y que le permita tener mayor capacidad y redundancia de la enorme cantidad de datos que manejará por noche. Según Francisco Förster, investigador asociado del MAS y líder de ALeRCE “esto nos permitirá tener una copia local de los datos más importantes, y así ganar en redundancia en caso de fallas, ahorro en costos de cómputo (por ejemplo, realizar un análisis sobre todos los datos), mayor rapidez para acceder a los datos para toda la comunidad nacional a través de REUNA, mayor independencia del proveedor de servicios en la nube y nos permitirá entrenarnos para manejar infraestructuras híbridas que serán cada vez más comunes en el futuro”

 

[/tagline_box][:]