Aprovechar soluciones innovadoras de IA en su laboratorio
Holden Galusha es el editor asociado de Lab Manager. Fue escritor colaborador independiente para Lab Manager antes de ser invitado a unirse al equipo a tiempo completo. Anteriormente fue el...
La inteligencia artificial (IA) ha sido un tema predominante en el ciclo de noticias durante los últimos meses. La IA, que es esencialmente la capacidad de una computadora para imitar la inteligencia humana, y el aprendizaje automático (ML), un subconjunto de la IA que puede mejorar la precisión de su producción de forma autónoma mediante el “entrenamiento” en conjuntos de datos, tienen el potencial de revolucionar industrias enteras. Algunos se muestran escépticos y piensan que la tecnología está sobrevalorada. Mientras tanto, para asombro de algunos y aprensión de otros, muchos creen que la IA será una revolución mayor que Internet. Una cosa es segura: como es el carácter pionero de los científicos, muchos profesionales de laboratorio están encontrando formas de incorporar soluciones de IA en sus flujos de trabajo.
Aprovechar las soluciones innovadoras de IA y aprendizaje automático ha abierto nuevas puertas en el análisis de datos, el procesamiento de imágenes y el monitoreo de laboratorio, pero al abrir esta caja de Pandora, también surgen desafíos importantes que la comunidad científica debe abordar.
Actualmente, los procesos de análisis de datos probablemente ofrecen la mayor cantidad de oportunidades para reforzar el flujo de trabajo de su laboratorio con AI/ML. La IA es particularmente adecuada para aumentar el análisis. Puede detectar patrones en los datos que son difíciles, si no imposibles, de detectar para los humanos. Esto da como resultado dos beneficios principales: (1) la IA puede aumentar el rendimiento del laboratorio al acelerar el proceso de análisis, y (2) la IA ofrece una capa adicional de inspección: los humanos y las máquinas trabajan en conjunto para verificar el trabajo de los demás y cubrir cualquier brecha.
Se han aplicado varias formas de IA en el análisis de datos experimentales, como el procesamiento de datos y el análisis de imágenes.
La IA y el ML han demostrado ser particularmente útiles en técnicas analíticas que incluyen cromatografía, espectrometría de masas y espectroscopia. Los fabricantes de instrumentación científica como METTLER TOLEDO, Agilent Technologies y JEOL han lanzado comercialmente soluciones de inteligencia artificial que mejoran las capacidades analíticas de quienes utilizan estas técnicas.
Una de esas soluciones es el software MassHunter de Agilent. MassHunter es un conjunto de programas que facilitan la recopilación eficiente de datos, el análisis cualitativo y cuantitativo, la generación de informes y otras funciones relacionadas con la cromatografía de gases y líquidos. En el verano de 2023, Agilent presentó un nuevo módulo para MassHunter: AI Peak Integration. AI Peak Integration aprovecha el aprendizaje automático para automatizar la integración de picos cromatográficos durante el análisis de datos, lo que reduce el tiempo total de procesamiento. Los usuarios pueden entrenar el modelo de forma personalizada realizando integraciones manuales para que pueda observarlo, y continuará aprendiendo y mejorando por sí solo.
De manera similar, el software msFineAnalysis AI de JEOL, diseñado para su uso con su espectrómetro de masas AccuTOF GC-Alpha JMS-T2000GC, utiliza dos modelos de AI integrados para sintetizar datos de alta resolución de GC/impacto electrónico, datos de alta resolución de GC/ionización suave y capacidades de análisis de estructuras para genera automáticamente análisis cualitativos detallados. Según JEOL, msFineAnalysis puede analizar 100 componentes en cuatro segundos, mientras que un analista experto tarda 30 minutos en analizar sólo cuatro componentes en promedio. Con msFineAnalysis, un analista puede ampliar considerablemente su ancho de banda.
...Pero al abrir esta Caja de Pandora, también surgen importantes desafíos que la comunidad científica debe abordar.
Por último, la solución AIWizard de METTLER TOLEDO utiliza una red neuronal, un tipo de aprendizaje automático que imita los cerebros biológicos, para una evaluación inteligente y automatizada de los efectos térmicos medidos por un calorímetro de barrido directo. La red viene previamente entrenada en miles de puntos de datos provenientes de evaluaciones de expertos. Como un cerebro real, la red seguirá aprendiendo y mejorándose a medida que se utilice. Con AIWizard, los usuarios pueden redirigir sus energías para extraer información de los datos evaluados por la IA, ahorrando tiempo y esfuerzo.
Una forma de IA comúnmente utilizada en los laboratorios es la tecnología de reconocimiento y análisis de imágenes. Esta tecnología se utiliza a menudo para identificar elementos de interés en fotografías microscópicas, escaneos médicos, transmisiones de cámaras en tiempo real, etc. Un ejemplo serían los contadores de células automatizados, que pueden contar células de forma independiente en los pocillos de microplacas. De manera similar, en un estudio de 2022, los investigadores aprovecharon el aprendizaje automático para identificar automáticamente células aisladas, lo que aliviaría la carga de los humanos para identificarlas en procesos de ingeniería biomédica.1
Un ambicioso proyecto basado en esta tecnología es FathomNet, un repositorio de imágenes oceánicas. Estas imágenes están destinadas a usarse en el entrenamiento de modelos ML en aplicaciones oceanográficas. Anunciado en octubre de 2022, FathomNet se fundó a partir de más de un millón de imágenes y más de 28 000 horas de vídeo, todos anotados y aportados por el Instituto de Investigación del Acuario de la Bahía de Monterey. También se agregaron más datos de la National Geographic Society y la National Oceanic and Atmospheric Administration. Idealmente, FathomNet acelerará la investigación oceánica y permitirá un monitoreo más efectivo de la salud de los océanos, entre otros casos de uso.2
Muchas soluciones comerciales de IA/ML están a la vanguardia de la tecnología, pero se siguen realizando más desarrollos en el espacio del software de código abierto. El software de código abierto es software cuyo código fuente está disponible gratuitamente para que cualquiera pueda descargarlo, modificarlo y ejecutarlo. Actualmente se están desarrollando numerosas soluciones de software de laboratorio de código abierto impulsadas por IA, algunas de las cuales se han presentado en revistas. Si bien algunos de ellos pueden estar listos para su uso en producción, pueden indicar cómo será el futuro del software analítico de IA.
Por ejemplo, un artículo de 2022 publicado en Bioinformatics presentó PeakBot, un modelo de aprendizaje automático que automatiza la selección de picos cromatográficos.3 Según los resultados del estudio, “en el entrenamiento y los conjuntos de datos de validación independiente utilizados para el desarrollo, PeakBot logró un alto rendimiento con respecto a la discriminación entre picos cromatográficos y señales de fondo (precisión de 0,99)”. Si bien ya existen soluciones cromatográficas de detección de picos basadas en algoritmos, como XCMS y MS-Dial, PeakBot, desarrollado por investigadores de la Universidad de Viena, automatiza aún más la selección de picos, ya que puede entrenarse con datos de referencia del usuario, lo que aumenta la precisión. El código utilizado para crear el modelo está disponible públicamente en GitHub, un repositorio de código basado en la nube.
La IA es particularmente adecuada para aumentar el análisis. Puede detectar patrones en los datos que son difíciles, si no imposibles, de detectar para los humanos.
Otro artículo de 2022 publicado en Nature Machine Intelligence detalla la creación de LC-MS2Struct, un modelo de aprendizaje automático que anota estructuralmente los metabolitos con mayor precisión que los puntajes convencionales de cromatografía líquida y espectrometría de masas en tándem (LC-MS2).4 Los autores del estudio construyeron el modelo compilando públicamente datos LC-MS2 de fase reversa disponibles de la base de datos de referencia pública MassBank. Estos datos de entrenamiento consistieron en 4327 moléculas medidas en 18 condiciones LC únicas de 16 laboratorios diferentes. Al haber sido capacitado con una variedad tan amplia de datos de tantos laboratorios diferentes, LC-MS2Struct puede distinguir con precisión variantes estereoquímicas, algo que ninguna otra solución de identificación de metabolitos puede hacer. Al igual que PeakBot, el código de este proyecto está disponible en GitHub.
Debido a que los programas de IA de código abierto están impulsados por la colaboración y el interés en la investigación, ofrecen una agilidad en el desarrollo que las soluciones comerciales pueden encontrar difíciles de igualar. A medida que avanzan los programas de código abierto, pueden servir como un pronóstico de las características que esperan las soluciones patentadas.
La IA se puede utilizar para monitorear los activos del laboratorio y su entorno. Los congeladores de temperatura ultrabaja (ULT) son un buen ejemplo. Las variaciones de temperatura superiores a unas pocas décimas de grado dentro de un congelador ULT pueden deteriorar las muestras. Sin embargo, estas variaciones no son obvias para el ojo humano cuando se revisan manualmente los registros de temperatura ULT. Una IA es mucho más adecuada para identificar estos patrones. Una vez que su IA integrada detecta un patrón de variaciones significativas de temperatura, el sistema de monitoreo de un congelador puede alertar al usuario del mal funcionamiento o falla inminente, permitiéndole abordarlo de manera preventiva y garantizar que sus valiosas muestras permanezcan intactas. La IA también puede analizar cómo se organizan las muestras dentro de un congelador y recomendar diferentes ubicaciones para ayudar a mantener la consistencia de la temperatura en todas las muestras.
La llegada de la IA generativa ha abierto el debate sobre qué tipos de trabajadores serán reemplazados por esta tecnología. Es comprensible que esto haya hecho que los trabajadores de todas las industrias se sientan aprensivos con respecto a la IA. Sin embargo, en el caso del trabajo científico, los científicos no deben preocuparse todavía: incluso si la IA realiza análisis manuales de manera más eficiente que los humanos, sus resultados deben ser revisados por humanos para garantizar la precisión y exigir responsabilidad.
Si bien esto representa seguridad laboral, también representa un desafío inherente a la automatización del análisis: verificar los resultados. Los modelos AI/ML están lejos de ser infalibles. Sería irresponsable y, posiblemente, poco ético no examinar de cerca sus conclusiones. El desafío radica en encontrar el equilibrio entre verificar adecuadamente los resultados y al mismo tiempo no dedicar tanto tiempo a la verificación que los ahorros proporcionados por la IA se anulen. Si bien algunas organizaciones están tomando medidas para abordar este problema, como la formación de un comité por parte del Colegio de Patólogos Estadounidenses para establecer estándares de laboratorio en aplicaciones de IA, hasta el momento no existen pautas para verificar los modelos de IA utilizados en los laboratorios.5
Otro obstáculo que pueden enfrentar los laboratorios al incorporar soluciones de IA/ML es la falta de experiencia técnica. Si un laboratorio desea entrenar un modelo de IA con sus propios datos, en lugar de utilizar uno previamente entrenado, requerirá que una persona o personas con el conocimiento técnico recopilen esos datos, los preparen para el entrenamiento, lleven a cabo el entrenamiento y luego implementen. ese modelo capacitado en una plataforma digital confiable y fácil de usar. Por esta razón, los laboratorios que no tienen experiencia interna o el presupuesto para contratar a un contratista para realizar ese trabajo deben seguir con soluciones de IA listas para usar. Si bien esas soluciones no incluirán los datos internos del laboratorio, la accesibilidad y la facilidad de uso aún pueden resultar valiosas.
La IA tiene el potencial de revolucionar la forma en que operan los laboratorios y, para algunas aplicaciones, ya lo ha hecho. Con la actual explosión de avances en IA, podemos esperar que se revelen más innovaciones. Sin embargo, antes de que esta tecnología pueda alcanzar su máximo potencial, se deben abordar desafíos como la verificación de datos, la accesibilidad y la creación de pautas claras y ampliamente aplicables para implementar esta tecnología.
Referencias:
1. Debnath et al. "Detección automatizada de células individuales modeladas dentro de hidrogel mediante aprendizaje profundo". Informes científicos. 31 de octubre de 2022. https://www.nature.com/articles/s41598-022-22774-0. Consultado el 5 de julio de 2023.
2. “Red Fathom”. mbari.org/data/fathomnet. Consultado el 7 de julio de 2023.
3. Bueschl et al. "PeakBot: selección de picos cromatográficos basada en aprendizaje automático". Bioinformática. 23 de mayo de 2022. https://academic.oup.com/bioinformatics/article/38/13/3422/6590644. Consultado el 2 de junio de 2023.
4. Bach et al. "Anotación estructural conjunta de moléculas pequeñas utilizando el orden de retención de cromatografía líquida y datos de espectrometría de masas en tándem". Inteligencia de la máquina de la naturaleza. 19 de diciembre de 2022. https://www.nature.com/articles/s42256-022-00577-2. Consultado el 19 de junio de 2023.
5. Blum, Karen. "Un informe de situación sobre la IA en la medicina de laboratorio". Asociación Estadounidense de Química Clínica. 1 de enero de 2023. https://www.aacc.org/cln/articles/2023/janfeb/a-status-report-on-ai-in-laboratory-medicine. Consultado el 17 de junio de 2023.
Referencias: