[con]Neurona Episodio 23

"IA Rica - IA Pobre" una historia sobre GPU, una historia sobre ricos y pobres, sobre nuestro modelo de vida, sobre nuestro futuro.

sep 02, 2023

Sponsor: → centraldecomunicacion.es ←
Listados empresariales actualizados con literalmente cerca de un MILLÓN de contactos reales y más de 400.000 correos contrastados.

Os quiero contar una historia sobre GPU, una historia sobre ricos y pobres, sobre nuestro modelo de vida, sobre nuestro futuro.

💠Un poco de Contexto

Una unidad de procesamiento de gráficos (GPU) es un chip de computadora que renderiza imágenes mediante la realización de cálculos matemáticos rápidos. En los últimos años, los investigadores han estado utilizando grupos de miles de GPU para acelerar la IA y las grandes cargas de trabajo de modelos de lenguaje.

💠La Fiebre de las GPU

Había una vez en el mundo de la tecnología, una demanda insaciable de unidades de procesadores gráficos (GPU). La compañía Nvidia, líder indiscutible en este ámbito, vislumbró un futuro brillante con un pronóstico impresionante: un aumento del 170% en sus ingresos para el trimestre actual, alcanzando la asombrosa cifra de aproximadamente 16 mil millones de dólares. Esta noticia dejó a todos boquiabiertos y generó un frenesí en la industria tecnológica.

💠Los Ricos en GPU: Quienes Dominan la Carrera de la IA

En este emocionante capítulo de la historia tecnológica, surgieron los "Ricos en GPU". Un grupo selecto de empresas, entre las que destacan OpenAI, Google, Anthropic, Amazon, Inflection, X y Meta, que poseían más de 20,000 GPU H100 en sus arsenales. Estas potencias tecnológicas estaban listas para proporcionar a los investigadores recursos informáticos sin precedentes. Algunas de ellas, como OpenAI, se comprometieron a tener más de 100,000 GPU en un futuro cercano. La batalla por el dominio de la IA estaba en su apogeo, y el destino de los mejores investigadores estaba en juego.

💠Los Desafíos de China en la Era de las GPU

Sin embargo, la trama se complicaba aún más con la presencia de China en esta historia. A pesar de su ambición en la carrera de la IA, China se enfrentaba a obstáculos significativos. La escasez de semiconductores de alta potencia amenazaba sus esfuerzos por mantenerse al ritmo de Estados Unidos. Además, las restricciones impuestas por Washington impedían a las empresas chinas comprar chips avanzados fabricados por Nvidia, lo que dificultaba la creación de rivales para ChatGPT de OpenAI. En un intento por sortear estas barreras, Nvidia ofrecía su procesador A800 en China, cumpliendo con las regulaciones de exportación de Estados Unidos, aunque este chip era más lento que los A100 y H100, empresas chinas como Alibaba, Baidu, ByteDance y Tencent han realizaron pedidos de miles de millones de dólares.

💠Los Pobres en GPU: Luchando en un Mundo Dominado por los Gigantes

En un rincón menos iluminado de esta narrativa, surgían los "Pobres en GPU". Nuevas empresas y valientes investigadores de código abierto que luchaban con un acceso limitado a las GPU, enfrentándose a desafíos inmensos.

Gastaban horas y esfuerzo tratando de lograr lo que, en comparación con los gigantes, parecía insignificante o inalcanzable. Muchos de ellos se veían atrapados en la tarea de ajustar modelos con GPU que carecían de suficiente memoria gráfica. Estas mentes creativas a menudo se veían obligadas a utilizar modelos de lenguaje más grandes para adaptarlos a sus necesidades. Sin embargo, lo que lograban comercialmente en su entorno de escasas GPU apenas tenía relevancia en un mundo que se preparaba para recibir más de 3.5 millones de GPU H100 en el próximo año.

💠La Europa Pobre: Una Región que se Queda Atrás

En el último acto de esta historia, la atención se dirigía hacia Europa. A pesar de sus esfuerzos, las nuevas empresas europeas y las supercomputadoras respaldadas por los gobiernos no lograban competir con los titanes tecnológicos. Europa se veía superada por la falta de capacidad, por que sí, mucha supercomputadora pero apostó por ser pobre en GPUs . Mientras tanto, hasta varios países de Oriente Medio estaban invirtiendo considerablemente en la creación de infraestructuras a gran escala para la IA, preparándose para un futuro en el que la tecnología dominaría todos los aspectos de la vida.

Europa, lamentablemente, quedaba rezagada en esta carrera tecnológica.

Fin de la Historia [Continuará …]

Vamos al lío con algunas de las noticias que me han parecido relevantes:

Meta [Code LLama]

Code Llama es un nuevo modelo de lenguaje diseñado para ayudar con las tareas de codificación. Es una extensión del modelo Llama 2 existente, optimizado para la generación de código en múltiples lenguajes de programación. Su objetivo es hacer que los desarrolladores sean más eficientes y ayudar a los recién llegados a aprender a codificar. También está disponible una versión especializada para Python.

Meta [SeamlessM4T]

SeamlessM4T es un modelo de voz Multimodal presentado este mes por Meta, que permite reconocimiento de voz para casi 100 idiomas, traducción de voz a texto para 100 idiomas de entrada y salida, traducción de voz a voz, compatible con 100 idiomas de entrada y 36 idiomas de salida, traducción de texto a texto para casi 100 idiomas, traducción de texto a voz, compatible con cerca de 100 idiomas de entrada y 35 idiomas de salida.

OpenAI [ChatGPT Enterprise]

OpenAI lanzó ChatGPT Enterprise, una nueva versión avanzada de ChatGPT diseñada para uso corporativo, que presenta seguridad mejorada, velocidades más rápidas y opciones de personalización. Adoptado por importantes empresas para tareas como comunicación y análisis de datos, ofrece seguridad de nivel empresarial, ventanas de contexto más largas y uso ilimitado.

Tesla

Tesla lanzó su tan esperada supercomputadora el lunes, según @SawyerMerritt. La máquina se utilizará para diversas aplicaciones de inteligencia artificial (IA), pero el clúster es tan potente que también podría utilizarse para cargas de trabajo exigentes de informática de alto rendimiento (HPC). De hecho, la supercomputadora basada en Nvidia H100 será una de las máquinas más poderosas del mundo. El nuevo clúster de Tesla utilizará 10.000 GPU de cómputo Nvidia H100.

Trabajo

A pesar de las huelgas de escritores y actores en USA, las empresas de cine y televisión, como Disney, Netflix, Sony y NBCUniversal, están contratando expertos en inteligencia artificial para diversos roles. Estas compañías han anunciado al menos 26 posiciones relacionadas con IA en las últimas semanas, con salarios que superan los 200,000 dólares al año en algunos casos.

Casos de Uso de la IA

UBER utiliza IA para entregar Comidas.

Uber Eats está desarrollando un chatbot con tecnología de inteligencia artificial para agilizar el proceso de pedido de alimentos. El chatbot preguntará a los usuarios sobre su presupuesto y preferencias alimentarias para ofrecer recomendaciones y ayudar a realizar pedidos.

📢ChatGPT para todos

Rafael Mourad , un miembro activo de nuestra comunidad, nos presenta esta guía básica pero esencial para navegar el apasionante universo de herramientas de Inteligencia Artificial 🤖 aplicadas a la creación de contenido multimedia. Desde cómo crear un prompt hasta el análisis de servicios de AI. Es Gratis o puedes apoyar al creador.
! Multiplica por 100 tu productividad ¡

Investigación

Interface para hablar

Los investigadores crearon una innovadora interfaz cerebro-computadora (BCI) que permite a una mujer paralizada comunicarse a través de un avatar digital. Este avance marca la primera síntesis del habla o de las expresiones faciales directamente a partir de señales cerebrales.

El sistema puede convertir estas señales en texto a una velocidad impresionante de casi 80 palabras por minuto, superando las tecnologías existentes. [vía Rafael Mourad en X]

Predecir el Cancer

K-ECAN es una herramienta de inteligencia artificial que utiliza registros médicos electrónicos para identificar a pacientes con alto riesgo de cáncer de esófago y de estómago. Esta herramienta tiene como objetivo aumentar la detección temprana alertando a los proveedores de atención médica sobre los pacientes que necesitan pruebas de detección. K-ECAN es más preciso que los métodos existentes y puede predecir el riesgo de cáncer al menos tres años antes del diagnóstico, independientemente de si los pacientes muestran síntomas de afecciones relacionadas.

Debemos estar atentos [SEO]

El gigante surcoreano de Internet Naver lanzó su propia herramienta de inteligencia artificial generativa, uniéndose a otras empresas en el lanzamiento de grandes modelos de lenguaje para competir con ChatGPT de OpenAI.

Naver es conocido como el Google de Corea del Sur, ya que es el principal motor de búsqueda del país. La compañía dijo que su modelo de lenguaje grande HyperClova X puede mejorar la búsqueda, así como las experiencias de marketing y compras para anunciantes y usuarios.

Privacidad y protección de datos

Facebook e Instagram adaptan su algoritmo IA de recomendación ( y TikTok) en la Unión Europea, a los usuarios de plataformas más grandes (19 de las cuales la UE designó en abril ) se les debe ofrecer la opción de un feed no algorítmico, donde la clasificación de contenido no se basa en el seguimiento. Y esto es importante.

No quiero que accedas a mis datos

Durante el mes de Agosto OpenAI , nos indicó las instrucciones para bloquear su bot de rastreo de internet, para todos aquellos que no desean que su contenido sea utilizado para entrenar a las IA(GPTbot) o por plugins con acceso a internet ChatGPT-User. Las instrucciones son las siguientes,

User-agent: ChatGPT-User Disallow:
User-agent: GPTBot Disallow: /

Hemos realizado un estudio exhaustivo, de cómo ha reaccionado a esto las principales web de contenido Españolas, proximamente ampliado a habla hispana en general.

Ámbito

Se han analizado 4.588 webs con dominio ”.es” y “.com” de ámbito local España, basado en la selección de Majestic de TOP 1.000.000 de webs, filtrando el TLD y las principales webs identificadas como españolas, en ese mismo conjunto de datos y cruzandolo con algunos datos disponibles de OJD y AHrefs.

Ejecutamos nuestro Script Semanalmente para futuros análisis de evolución. Los datos mostrados a continuación son del día 2/Septiembre/2023 iniciado a las 11:15h.

Bots de OpenAI.

GPTbot: (Las páginas web rastreadas con el agente de usuario GPTbot pueden usarse potencialmente para mejorar modelos futuros y se filtran para eliminar fuentes que requieren acceso al muro de pago, o se sabe que recopilan información de identificación personal (PII) o tienen texto que viola sus políticas)

GPT-User: (Es utilizado por complementos en ChatGPT. Este agente de usuario solo se utiliza para realizar acciones directas en nombre de los usuarios de ChatGPT y no se utiliza para rastrear la web de forma automática)

Resultados.

Solo 52 webs de las analizadas, están bloqueando alguno de estos robots o ambos de OpenAI. Son estos dominios,

Sorprende que el número de Webs que bloquea el bot de datos de entrenamiento (GPTbot) sea mayor que el de datos para plugins(GPT-user) que realmente es el que puede “trabajar” con nuestro contenido más reciente, así tenemos que:

Bots de Common Crawl

CCBot: (Common Crawl mantiene un repositorio abierto y gratuito de datos de rastreo web que cualquier persona puede utilizar con más de 240 mil millones de páginas que abarcan 16 años. Es el más utilizado como Corpus de formación primaria para LLMs) .

Resultados

53 webs bloquean el bot de Common Crawl y como puedes observar no son siempre coincidentes.

El script estará disponible en Discord a partir del Lunes, con una Interface fácil de manejar y el informe completo se publicará en iAradar.com próximamente. Como curiosidad, de toda esta muestra 108 web bloquean un bot de Twitter llamado Twitterbot que todavía no sabemos para qué se utiliza, y ninguna bloquea la IA de Anthropic.

La imagen

John Wick turning Super Saiyan … con Leonardo.ai

Esto es todo amigos, hasta la semana que viene esperamos que te haya entretenido el boletín y te sirva para estar informado con todas las novedades interesantes sobre inteligencia Artificial. No olvides de suscribirte .

o quizás quieras compartir nuestra NewsLetter en las redes sociales …

Para poder anunciarse en la newsletter [con]Neurona contacta en el correo eléctronico txetxudev@gmail.com o a través de Twitter[x] en @Txtetxu1

[con]NEURONA

Discusión sobre este post