[con]Neurona Episodio 20
Los datos son esenciales para el funcionamiento de las iA Generativas. Son como la gasolina que hace funcionar un coche.
Sponsor: → centraldecomunicacion.es ←
Listados empresariales actualizados con literalmente cerca de un MILLÓN de contactos reales y más de 400.000 correos contrastados.
Los modelos de IA requieren una cantidad significativa de información para poder aprender y mejorar su capacidad de respuesta.
Se necesitan datos
En este sentido, OpenAI ha estado trabajando para recopilar datos de diversas fuentes en Internet. La estrategia que se planteó inicialmente fue "tomar prestados" datos de plataformas ricas en contenido como Twitter y Reddit. Sin embargo, estas empresas pronto se dieron cuenta de la situación y dijeron: "No, no, no. Si quieres nuestros datos, tienes que pagar".
Ante esta situación, OpenAI ha comenzado a buscar asociaciones directas para obtener acceso a sus datos. Tan solo esta semana, han forjado alianzas con dos empresas destacadas:
The Associated Press: OpenAI ha aprovechado los archivos de noticias de esta renombrada agencia, que datan desde 1985. Esta colaboración permitirá a OpenAI acceder a una gran cantidad de información histórica y actual.
Shutterstock: OpenAI ha obtenido acceso al extenso repositorio de imágenes, videos, música y metadatos de Shutterstock. Esta asociación brinda a OpenAI una fuente invaluable de datos visuales y multimedia.
A medida que todo esto avanza, es probable que veamos un aumento en los esfuerzos por adquirir y utilizar datos de diversas fuentes para impulsar el desarrollo de modelos más avanzados. La capacidad de acceder a datos específicos se está convirtiendo en un factor determinante en la búsqueda de la excelencia en la IA.
ChatGPT versus Bard
Bard ya está disponible en la mayoría de los países, incluida la Unión Europea, aun así ChatGPT tiene un tráfico 16 veces superior al chat de Google. ¿Por qué ?, sencillo, es mejor en casi todo: escritura, codificación y razonamiento.
Quizás sea por esto que Google anunció una serie de mejoras,
puede escuchar las respuestas (en más de 40 idiomas).
posibilidad de exportar código a Replit.
Usar imágenes en las indicaciones.
Claude v2
Anthropic lanzó Claude v2 y es, con mucho, el mayor competidor que he visto de ChatGPT. Va un poco por detrás cierto, pero es similar en codificación, tiene datos de entrenamiento más recientes (alrededor de principios de 2023) y admite más contexto.
Por más contexto, queremos decir mucho más: ¡ 75,000 Tokens ! Esto significa que lo podemos alimentar con documentos muy, muy extensos y obtiene resúmenes en segundos. Además, su API es 4-5 veces más barata.
Elon Musk lanza X.ai
"X" es una especie de empresa de investigación de IA cuyo objetivo es comprender la verdadera naturaleza del universo, si te paras a pensar, suena como un gran idea después de haberse fumado un “porro” una noche de verano.
Eso sí, el equipo fundador está repleto de ingenieros/investigadores de IA de OpenAI, Google y otros. Si tenemos en cuenta la premisa con la que comenzamos esta edición la Newsletter y los datos son la gasolina de cualquier LLM, entonces tienen una gran ventaja y esta es:
el acceso exclusivo a Twitter y al corpus masivo de datos de entrenamiento de texto, imágenes y videos de Tesla.
Más Noticias
Meta pronto lanzará una versión comercial de LLaMA para que las empresas puedan crear productos a partir de ella.
Anthropic está organizando su primer hackathon " Build With Claude " en San Francisco el 29 y 30 de julio. Los equipos ganadores recibirán más de $ 10K en premios en efectivo y créditos para poner en marcha sus proyectos.
Me ha llamado la atención GigaBrain un motor de búsqueda entrenado en miles de millones de foros de Reddit para encontrar las respuestas más útiles.
La evolución de POE es muy interesante, poco a poco ha ido incorporando los chatbot más importantes, puedes acceder a los últimos modelos de Anthropic, GPT-4, un generador de prompts para MidJourney entre otras funcionalidades. Muy útil también la opción para Crear tus propios Bots.
Otra buena idea es Julius, un chat con los datos de cualquier hoja de Cálculo, ya sea Excel, Google Sheet … (ojo con la idea).
Adobe Firefly ha producido más de mil millones de imágenes y ahora admite mensajes en más de 100 idiomas .
Stable Doodle crear a partir de un boceto imágenes en diferentes estilos. Podéis probarlo en Clipdrop gratis.
Pinecone, la base de datos de embeddings anunció una asociación con Microsoft Azure para acelerar las aplicaciones de IA generativa para los clientes de Azure.
Hollywood de huelga y la iA está en el centro de las reclamaciones
El sindicato de actores Norteamericano está en huelga, su peticiones son similares a las de los guionistas (que ya llevan 3 meses). Exigen mejoras salariales y reclaman además protección ante la amenaza que pueda suponer la inteligencia artificial para su trabajo en los próximos años.
"Creemos que es absolutamente vital que esta negociación proteja no solo nuestra imagen, sino que se asegure de que recibamos una buena compensación cuando parte de nuestro trabajo se utilice para entrenar a la inteligencia artificial".
NotebookLM
Google cambió el nombre de su herramienta de toma de notas impulsada por IA, anteriormente llamada Project Tailwind, a NotebookLM y la lanzó a un grupo selecto de usuarios en los EE. UU. De momento solo compatible con Google Docs la aplicación permite a los usuarios seleccionar documentos y usar NotebookLM para hacer preguntas o generar contenido nuevo basado en ellos.
También podrá resumir automáticamente documentos extensos o crear guiones a partir de esquemas de video. Incluye funciones de citas para ayudar a la verificación rápida de hechos, aunque Google advierte que la herramienta puede cometer errores ocasionalmente y su precisión depende de la exactitud de la información ingresada.
Código Python
Compartimos 2 pequeños Script que sirvieron de ejemplo en nuestro curso de Python, que todos los martes compartimos en Discord.
Utilizando la API de #OpenWeather y #ChatGPT 3.5, analizamos el pronóstico del tiempo y creamos un artículo. Siéntete libre de cambiar los prompt y modificar el código para obtener los mejores resultados posibles.
Código Fuente [Discord]
Otro Ejercicio, en esta ocasión utilizamos 3 artículos de prensa de internet que analizan el debate electoral entre Pedro Sánchez y Nuñez Feijóo y generar dos post antagónicos cada uno de ellos a favor de un candidato.
Código Fuente [Discord]
En los propios foros puedes solicitar ayuda para la ejecución y/o adaptación de los scripts a tus necesidades.
La imagen
La pasada semana no hubo Newsletter parte de la culpa la tiene … Victor.
Y esto es todo por esta semana, espero que te hayas entretenido con las novedades en Inteligencia artificial, no olvides darle cariño, suscribirte y compartir nuestro boletín.
Sponsor: → centraldecomunicacion.es ←
Listado de empresas de España organizado por actividades un conjunto de datos de calidad ideal para tus proyectos de datos.