[con]Neurona Episodio 24

"La idea de que el conocimiento es demasiado peligroso para que la gente tenga acceso a él tiene un nombre: Oscurantismo."

dic 02, 2023

No es Python pero si un Culebrón.

Seguro que ya lo sabes, pero te resumo: El director ejecutivo de OpenAI, Sam Altman fué despedido el més pasádo, con polémica. Y unos días después , reintegrado, creando un revuelo aún mayor.

En este intervalo de tiempo, … interviene Microsoft para proteger su inversión a través de su CEO Satya Nadella , intentan buscar un Director Ejecutivo de transición y soportan una carta de renuncia del 95% de los trabajadores de OpenAI, … vamos colapso total.

He oído muchas especulaciones, sobre el motivo del despido, y absolutamente ninguna con una base sólida que la sustente. (Así que aquí, no te voy a hablar de eso).

Pero …

Si algo aprendimos de la telenovela de OpenAI y Sam Altman, es que las marcas están construidas sobre la conexión emocional entre las personas y una entidad empresarial, si cualquiera de las relaciones falla, la perjudicada siempre será la marca.

Las denuncias sobre derechos de autor, las alucinaciones de ChatGPT … no son tan importantes, pero si la marca es afectada … hay un problema y gordo.

Tras el despido de Altman, los empleados de OpenAI demostraron una notable unidad y poder, resistiendo los intentos de otras empresas de reclutarlos, y plantando cara a la situación generada, y ¿sabéis?. Todo lo sucedido demuestra que son los individuos en OpenAI quienes ocupan el centro de esta historia.

Iniciamos la Segunda temporada de [con]Neurona nuestra NewsLetter sobre inteligencia Artificial.

Uno de los principales problemas de esta temática es intentar trasladar todas las ideas novedosas detrás de las IA y poder llegar al mayor público posible, no queríamos convertirnos en un boletín dedicado a enumerar Aplicaciones y Modelos (que también), nos gustaría llegar a los conceptos aunque sea de una forma superficial.

Conceptos para hablar como un “Pro”

Hoy os dejo dos conceptos que seguramente aparecerán en muchas de las conversaciones y comentarios sobre Inteligencia Artificial, se trata de AGI y ASI, dos conceptos relacionados que se teorizan sobre niveles diferentes de inteligencia artificial:

AGI (Inteligencia Artificial General):

- La AGI se refiere a la capacidad de un sistema de inteligencia artificial para entender, aprender y realizar cualquier tarea cognitiva que un ser humano pueda hacer.

- Un sistema con AGI tendría la capacidad de aplicar su inteligencia a una amplia gama de actividades, de manera similar a como lo haría un ser humano.

- La AGI implica versatilidad y adaptabilidad en la resolución de problemas, lo que significa que el sistema puede enfrentarse a diferentes situaciones y aprender de ellas.

ASI (Superinteligencia Artificial):

- La ASI, por otro lado, va más allá de la inteligencia humana. Se refiere a un nivel de inteligencia artificial que supera significativamente la capacidad cognitiva de los humanos en todas las áreas posibles.

- Un sistema con ASI no sólo igualará a la inteligencia humana en diversas tareas, sino que la superaría, siendo capaz de realizar incluso las tareas más complejas de manera más efectiva y eficiente.

- La ASI implica un nivel de inteligencia que podría tener un impacto masivo en la sociedad y en la resolución de problemas a una escala global.

Educación

Curso de Víctor Mollá

Víctor Mollá, gran experto en IA, lanza un curso muy interesante en Domestika, el curso consta de 4 módulos (unas 2 horas de duración) y estará durante las próximas 6 horas a 7,99€.

A través de las diferentes lecciones aprenderás de forma sencilla:
- Qué es realmente la IA y Cómo funcionan los LLM
- Por qué ChatGPT es realmente es algo revolucionario
- Cómo debes comunicarte con estas IAs
- En qué casos debes usar ChatGPT y en cuáles no
- Técnicas de Prompting para obtener mejores resultados

[ Enlace al Curso en Domestika ] [ Anuncio en Linkedin ]

Universidad Autónoma de Madrid

La UAM ha publicado para sus docentes y estudiantes una breve guía centrada en recomendaciones para un uso adecuado de la IAGen (Inteligencia Artificial Generativa).

Básicamente insiste sobre estos puntos:

Explica qué son las IAGen (Inteligencia Artificial Generativa) y cómo pueden ser útiles en educación superior. (Se centra en el modelo ChatGPT).
Ofrece recomendaciones a docentes sobre cómo usar IAGen para diseñar actividades formativas, evaluación y aplicarla éticamente.
Brinda consejos a estudiantes sobre cómo emplear IAGen para aprender, así como recomendaciones éticas.
Describe acciones de la UAM ante el surgimiento de IAGen: grupo de trabajo, encuesta, seminarios, mensajes informativos y cursos de formación.
Destaca la importancia de que IAGen no sustituye el trabajo y creatividad humanas ni sea suficiente para preparar clases o evaluaciones.
Advierte que los contenidos de IAGen pueden ser falsos o contener errores, por lo que se requiere pensamiento crítico.
Aconseja a docentes plantear actividades que requieran análisis, razonamiento y exploración a partir de lo generado por IAGen.
Sugiere a estudiantes usar IAGen para tareas básicas pero siempre contrastar y ampliar con otras fuentes.
Recalca la necesidad de un uso ético, genuino y responsable de estas herramientas.

🔗 Guía UAM sobre uso de la IA Generativa (Universidad Autónoma de Madrid): [Documento en Formato PDF]

Novedades Código Abierto

Meta: Seamless

Seamless, son una serie de modelos de audio de Meta, y lo cambian todo en materia de traducción simultánea, la mejor manera de explicar su funcionalidad es que lo pruebes tú mismo activando tu micrófono y/o cámara de video:
Esta es la demo de Seamless Expressive:

Otras 🔗 demostraciones en HuggingFace, o puedes descargar el código, modelo y datos.

Fuyu-8B

🔗 Fuyu-8B, es una versión pequeña de un modelo multimodal 🔗 disponible en HuggingFace, diseñado específicamente para Agentes. Tiene una arquitectura y un procedimiento de capacitación mucho más simples que otros modelos multimodales, lo que lo hace más fácil de entender, escalar e implementar.

Está diseñado desde cero para agentes digitales, por lo que puede admitir resoluciones de imágenes arbitrarias, responder preguntas sobre gráficos y diagramas, responder preguntas basadas en la interfaz de usuario y realizar una localización detallada en imágenes de pantalla.

Es muy rápido: podemos obtener respuestas para imágenes grandes en menos de 100 milisegundos.

A pesar de estar optimizado para un caso de uso (agentes), funciona bien en los puntos de referencia estándar de compresión de imágenes, como la respuesta visual a preguntas y los subtítulos de imágenes naturales.

SDXL Turbo

Stability AI ha lanzado SDXL Turbo, un modelo de generación de texto a imagen en tiempo real que utiliza una novedosa técnica llamada Adversarial Diffusion Distillation. El modelo sintetiza la salida de imágenes en un solo paso, manteniendo al mismo tiempo una alta fidelidad de muestreo.

Lo puedes probar en Clipdrop
[ Ejemplo propio ]

Los Grandes Actores

Amazon Q

Amazon está dedicando significativos recursos a la inteligencia artificial, y recientemente ha presentado 🔗 Amazon Q, un avanzado asistente de IA generativa. El sistema tiene la capacidad de responder preguntas, ofrecer resúmenes, generar contenido y llevar a cabo tareas basadas en datos provenientes de los sistemas empresariales, todo ello a través de una interfaz web.

Lo que distingue a Amazon Q de otros ChatBots es su enfoque centrado en la privacidad de los datos, básicamente genera respuestas e información utilizando el material y conocimientos que le proporciona el usuario, respaldando sus resultados con referencias y citas extraídas de documentos fuente.

.- 🔗 Amazon Q: Preview. [Precios: de “momento” 🔗 dos planes de 20$/mes y 25$/mes]

Titan Image Generator G1

A través de BedRock ahora también tenemos acceso a Amazon Titan la familia de Modelos entrenados previamente por AWS en grandes conjuntos de datos. A los ya conocidos de texto, acaba de añadir Titan Image Generator G1 un modelo de generación de imágenes. Genera imágenes a partir de texto y permite a los usuarios cargar y editar una imagen existente. Los usuarios pueden editar una imagen con un mensaje de texto (sin máscara) o partes de una imagen con una máscara de imagen … [🔗 Demo Video]

Amazonがプロンプトからさまざまな画像を生成できる画像生成AI「Titan Image Generator」のプレビュー版をAmazon Bedrockユーザー向けにリリース - ライブドアニュース

MetNet-3 de Google

Un modelo meteorológico neuronal de última generación. MetNet-3 proporciona predicciones de alta resolución con hasta 24 horas de anticipación precipitaciones, temperatura de la superficie, la velocidad y dirección del viento o el punto de rocío. Esto se integrará en todos los productos de Google.

Pronto Largometrajes con iA

Las últimas salidas de vídeo de IA son tan buenas que estamos a pocos minutos de pasar del texto a la película.

Pika 1.0

Los laboratorios Pika han anunciado su modelo de texto a vídeo e imagen a video, y sorprende la calidad. Estamos un paso más cerca de generar largometrajes completos por la mañana y tenerlos a tiempo para la sobremesa.

Utilidades

Transcribe 150 minutos (2,5 horas) de audio en menos de 98 segundos con Whisper Large v3 de OpenAI . Necesitarás tener GPU cuda o MAC ¡La transcripción increíblemente rápida ya es una realidad!
Una colección de experimentos, para probar openai vision api.

La API de la Semana

LeMUR: crea aplicaciones LLM con datos de voz

LeMUR de AssemblyAI nos permite crear aplicaciones que aplican LLM al habla. Con solo unas pocas líneas de código, puedes buscar, resumir, hacer preguntas y generar texto en sus datos de audio y video.

Algunos cuadernos en Python para Jupyter/Colab de ejemplo:

Curiosidades

NVidia

NVIDIA vendió casi medio millón de sus (tarjetas gráficas) GPU H100 para inteligencia artificial y computación de alto rendimiento en el tercer trimestre de 2023, en gran parte debido a las compras de Meta y Facebook. La demanda es tan alta que el plazo de entrega para los servidores basados en H100 oscila ahora entre 36 y 52 semanas.

OpenAI

OpenAI registra las marcas GPT-5, GPT-6 y GPT-7 …( “GPT-8” de momento no). También registra un curioso logotipo. "La marca consiste en una estrella dentro de un círculo con otro círculo en el centro de la estrella." ¿Se viene, renovación de imagen?

La Imagen

La imágen está generada con Leonardo.ai que ha incorporado nuevas opciones para entrenar o afinar modelos.

Lecturas recomendadas

Gran hilo en Hacker News que compara el ajuste y las indicaciones, y cómo ajustar Llama 2 para reemplazar GPT-3.5/4.
Otra gran explicación de cómo funciona realmente la IA Generativa.
La IA detecta enfermedades oculares y el riesgo de Parkinson a partir de imágenes de retina en Nature
Primer aniversario de ChatGPT: cómo cambió el mundo lectura en VentureBeat

Nos vemos el próximamente en una nueva edición de [con]Neurona, espero que os haya aportado algo de luz en todo este maremágnum de novedades en el mundo de la inteligencia artificial. Comparte nuestro enlace para llegar a más gente …

Puedes contactar con nosotros para promocionar tus proyectos o para anunciarte en [ iaradar.magazine@gmail.com ] o en mensaje directo a traves de X/ [twitter.com/Txtetxu1]

[con]NEURONA

Discusión sobre este post