La IA de Google entra a la competencia en este ramo, aunque muchos aseguran que viola derechos de autor
Agencia Excélsior
Google tiene como objetivo que cada vez más personas utilicen Bard para impulsar su creatividad y productividad, y para lograrlo acaba de lanzar varias actualizaciones, siendo una de las más llamativas la generación de imágenes.
Este chat de inteligencia artificial generativa fue presentado en febrero del año pasado como una tecnología en etapa temprana y para el mes de marzo fue abierta al público en inglés para usuarios de Estados Unidos y Reino Unido.
Para mayo, Google anunció la expansión a 180 países y en julio sumó más de 40 idiomas en su repertorio, entre ellos el español.
La nueva actualización permitirá que los usuarios generen imágenes en Bard sin costo alguno, eso sí, el comando deberá ser dado en inglés.
La tecnológica explicó que dicha función se basa en el modelo Imagen 2 que ofrece resultados fotorrealistas y en alta calidad.
Para generar una foto, los usuarios sólo deben describir en inglés qué es lo que quieren, por ejemplo, crear una imagen de un perro montando una tabla de surf. Bard analizará el comando y generará varias imágenes para que el usuario elija.
Google toma en serio la privacidad y seguridad, por eso las imágenes generadas con Bard contarán con una marca de agua digital que son identificables directamente en los píxeles gracias al programa SynthID.
También se limitará la generación de imágenes con contenido violento, ofensivo o sexualmente explícito, a lo que se añaden filtros para evitar la generación de imágenes de personas reales.
Sin embargo, algunos especialistas y abogados como Gary Marcus aseguran que al usarlo y pedirle que genere imágenes, como por ejemplo fontanero de videojuegos o personaje animado amarillo con gafas, crea a Mario Bros. o a los minions, lo cual los mantendrá ocupados con demandas por violaciones a derechos de autor.
Herramientas
La tecnológica también reveló que Gemini Pro ahora estará disponible en Bard en más de 40 idiomas y en 230 países. Anteriormente sólo se podía utilizar en inglés.
Se trata de un modelo de lenguaje grande multimodal desarrollado por Google DeepMind, que se alimenta y genera varios tipos de información como textos, imágenes, audio y hasta código de programación.
Uno de los líderes de los modelos lingüísticos, Large Model Systems Organization aseguró que Bard con Gemini Pro es uno de los asistentes disponibles preferidos.
Por otro lado, Google anunció que la función de Doble Verificación en las respuestas de Bard ahora estará disponible en más de 40 idiomas.