[con]Neurona Episodio 33
Muchos lanzamientos esta semana y nuevas revisiones en tus LLM favoritos. Aun así, siguen creciendo los mensajes subliminales "negativos" sobre la tecnología.
Por una Inteligencia Artificial de código abierto.
Una oleada de artículos en la prensa [ejemplo en Financial Times] e incluso en revistas tecnológicas muy respetadas llevan un tiempo pidiendo el control de las IA y claro, la muerte del código abierto en este campo.
Quieren que sea imposible hacer una investigación abierta y quieren impedir que se compartan los pesos de los modelos de inteligencia artificial. Están azuzando el miedo, respaldados por movimientos globales financiados de grupos que promulgan el riesgo existencial de IA.
Todos estos tienen en común que les gusta obviar que la Inteligencia Artificial es un enorme potencial para transformar la medicina descubriendo nuevos antibióticos, hacer que los automóviles sean mucho más seguros, agilizar nuestras habilidades de codificación, traducir textos a idiomas menos utilizados, … en definitiva, que les gusta omitir que la IA está ayudando a difundir el conocimiento.
Si todo estos grupos triunfan, nos quedaremos atascados con una IA insípida, diluida y capada, mientras que los estados avanzarán con la vigilancia a la que nos someten.
El ejemplo de Linux
Linux, es un sistema operativo de código abierto, que se ejecuta en las 500 supercomputadoras más importantes del planeta, todos los laboratorios de IA de esas empresas que ahora nos venden sus productos (cerrados), trabajan con alguna variante de Linux.
Pero tenéis que saber que, en los primeros días de Linux, este también sufrió ataques. En la década de los 90 y principios de 2000, Microsoft y Sco querían destruir Linux. Nos dijeron que destruiría el capitalismo y la propiedad intelectual y dejaría a las grandes empresas fuera del negocio, Microsoft lo llamaba “Cáncer”. ¿ Os Suena ?
Que ironia, imaginaros si Microsoft hubiera tenido éxito. Habrían destruido su propio modelo de negocio actual, ya que Linux ahora ejecuta más del 60% de las cargas de trabajo de los clientes en su nube de Azure.
La Legislación
“Han suplantado a Taylor Swift …” [El País], “Roban 24M de euros con inteligencia artificial [El Confidencial]”, titulares clickbait con un único objetivo, amplificar lo perjudicial de esta tecnología.
Los gobiernos, ante una expectativa de que la IA sea una “máquina de destruir” se han apresurado a “legislar” su uso y distribución,
pero párate a pensar:
¿Qué tipo de leyes necesitamos para regular la IA? La respuesta es que en la mayoría de los casos, no necesitamos nuevas, ni especiales reglas.
Si alguien hace una voz sintética de una persona y te llama para estafarte , eso sigue siendo fraude, incluso si la táctica es nueva. Es solo una variación de una estafa , que por cierto (las estafas) se remontan a la “española” documentada en 1854, [2] y si, después llegaron versiones más modernas, la estampita con la imprenta, otras en la era del fax y más tarde el phishing … etc, etc.
Pero no olvidemos que, ya es ilegal estafar a la gente con dinero y deberíamos castigar a las personas que lo hacen con todo el peso de la ley, con IA o sin IA.
La lectura
Detrás de todo este pensamiento está una serie de Tweet/x largos pero muy coherentes de Daniel Jeffries "El experto de XYZ dice que la IA es peligrosa" …
Y un artículo mucho más amplio e imprescindible en su boletín.
Novedades de la semana
Muchos lanzamientos esta semana, y nuevas funcionalidades.
Google presenta Gemini Advanced, su servicio de chat basado en Gemini Ultra 1.0. Puedes probarlo durante 2 meses gratis y después 22 euros al mes.
La API de Mixtral ya está disponible para cualquiera que quiera utilizarla, podemos usar los modelos abiertos a través de HuggingFace y los propietarios a través de su servicio.
DeepSeek ha mejorado y mucho su modelo LLM, al cual puedes acceder mediante chat, y regala 20 millones de tokens, para usar con su nueva API, compatible con el SDK de OpenAI. Esto significa que todo lo desarrollado para los modelos más populares se adapta perfectamente a su API .
Se presenta el modelo, Stable Audio … que permite generar composiciones, musicales bastante largas y de calidad.
Apple, libera un modelo para modificación y ajuste de imágenes. Recorta, redimensiona, agrega filtros, añade o quita objetos, cambia contraste, brillo, color ... y todo con indicaciones de texto.
DeepSeekMath: Acercándose a la capacidad de razonamiento matemático de GPT-4 con un modelo 7B, el modelo chino ha logrado una puntuación impresionante del 51,7 % en el punto de referencia MATH a nivel de competencia sin depender de kits de herramientas externos ni técnicas asistidas.
Marcas “de Agua” por todos lados
Esto también ha sido noticia durante la semana, la incorporación de manera nativa de Marcas de Agua y/o Metadatos en las imágenes.
OpenaAI, ha comunicado que están incorporando Metadatos a las imágenes, las imágenes generadas con ChatGPT en la web y con la API que sirve al modelo DALL·E 3 ahora incluirán metadatos C2PA. Por si no los sabes, C2PA [c2pa.org] es un estándar de marcado de la industria que también suelen utilizar cámaras fotográficas, notas de prensa, scanners etc..
Meta ha anunciado que "en los próximos meses" identificará y etiquetará de forma automática las imágenes fotorrealistas publicadas en Facebook, Instagram y Threads que hayan sido creadas con Inteligencia Artificial (IA) generativa, para ello utilizará herramientas de otras empresas. [ EP ]
Marketing e Inteligencia Artificial
Continuando con Meta, ahora también sabemos que, el 40% del contenido que la gente ve en Instagram proviene de recomendaciones de IA. También señala que durante el año pasado, sus recomendaciones de IA impulsaron un aumento del 7% en el tiempo dedicado a Facebook y un aumento del 6% en IG.
El tiempo de visualización diaria de todos los tipos de vídeos aumentó más de un 25 %, la gente comparte Reels 3.500 millones de veces cada día.
Whisper incorpora marcas de tiempo a su API
La API de Whisper ahora admite marcas de tiempo a nivel de palabras y segmentos, lo que hace que la edición de audio/video sea mucho más fácil.
De forma predeterminada, la API de Whisper generará una transcripción del audio proporcionado en texto.
En concreto el parámetro timestamp_granularities[]
habilita un formato de salida json
más estructurado y con marcas de tiempo a nivel de segmento, palabra o ambos.
Esto permite una precisión a nivel de palabra para transcripciones y ediciones de vídeo.
La Imagen
Con LeonardoAI → “high quality, 8K Ultra HD, lots of musical note symbols inside an apple made of crystal, by yukisakura, high detailed,”
Modelos para implementar en Local
Estos son los modelos que hemos probado y que funcionan muy bien en Local sin necesidad de GPU especializada, utilizando Ollama o LMStudio.
mistral 7B
codellama:7b y codellama:13b
deepseek-coder 1.3b y deepseek-coder 6.5b
phi 2.7b (El modelo pequeño de Microsoft)
EVA-CLIP-8B (de Beijing Academy of Artificial Intelligence) nuevo👌
Qwen1.5-0.5B-OpenHermes-2.5 → nuevo 👌
Y hasta aquí una edición más de con[Neurona] espero que os haya gustado, muchas gracias si has llegado hasta el final. No dudes en compartir este boletín en redes sociales, suscribirte y comentarnos.
Si deseas promocionar tus proyectos o anunciarte con nosotros, puedes ponerte en contacto a través de [iaradar.magazine@gmail.com] o mediante mensaje directo en [twitter.com/Txtetxu1]. ¡Estaremos encantados de colaborar contigo!