Se está introduciendo una nueva forma de explorar y organizar imágenes en la aplicación de Google.
Google está lanzando una nueva función en su aplicación que facilita descubrir y organizar contenido visual. A partir de ahora, encontrar inspiración será más sencillo con un nuevo ícono de «Imágenes» en la parte inferior de la pantalla de la app. Al tocarlo, los usuarios podrán ver imágenes nuevas cada día, ajustadas a sus intereses personales. Esto resulta especialmente útil cuando no se sabe exactamente lo que se busca, pero se reconoce al verlo.
Con esta funcionalidad, los usuarios tendrán la opción de navegar, guardar en sus colecciones o buscar más inspiración basada en lo que encuentren. Se trata de una manera efectiva de organizar ideas creativas, desde ese primer destello de inspiración hasta el desarrollo de proyectos completos, todo en un mismo lugar. Esta actualización estará disponible en las próximas semanas para las aplicaciones de Google en Android e iOS en los EE. UU.
Fuente del artículo original: https://blog.google/feed/search-images-tab-browse-organize/?utm_source=futuretools.io&utm_medium=newspage
Epidemic Sound lanza la herramienta de inteligencia artificial ‘Studio’ para generar bandas sonoras de video

Epidemic Sound, una plataforma de licencias musicales con sede en Estocolmo, ha presentado ‘Studio’, un innovador producto impulsado por inteligencia artificial que promete transformar la creación de bandas sonoras para videos. Studio analiza videos cargados y genera una banda sonora sincronizada utilizando música de su catálogo, además de sonidos ambientales y efectos foley. Esto permite a los creadores reducir significativamente el tiempo dedicado a la edición de audio, optimizando así la producción audiovisual.
Este lanzamiento refleja el compromiso de Epidemic Sound de potenciar la creatividad humana sin reemplazarla, al ofrecer herramientas que faciliten la expresión artística. Studio garantiza que el contenido esté acompañado de una banda sonora coherente y legalmente segura, adaptándose a las necesidades específicas de los creadores, desde influenciadores hasta cineastas. Este desarrollo se enmarca en un contexto donde la música generada por IA está en auge, con otras plataformas reportando una gran cantidad de uploads diarios creados por inteligencia artificial.
Fuente original: Music Business Worldwide
World Labs de Fei-Fei Li acelera la carrera de modelos mundiales con Marble, su primer producto comercial

Marble es una innovadora herramienta en el ámbito de las tecnologías de modelado mundial presentada por World Labs de Fei-Fei Li. A diferencia de sus competidores, como Odyssey, Decart, y Google’s Genie, que generan mundos de manera instantánea mientras se exploran, Marble crea entornos 3D persistentes y descargables. Esta característica distintiva permite a los usuarios interactuar con estos entornos de una manera más inmersiva, haciendo que la experiencia sea más intensa y única.
Este avance llega en un momento en que la demanda de tecnología inmersiva avanzada está en aumento, con aplicaciones que abarcan desde el gaming hasta la educación y simulaciones virtuales. Al centrarse en la creación de entornos descargables, Marble se diferencia en un mercado que a menudo enfatiza la generación en tiempo real, ofreciendo a los usuarios una experiencia más personalizada y permanente. Esto no solo mejora el compromiso del usuario, sino que también abre oportunidades para los desarrolladores que buscan crear aplicaciones sólidas en estos entornos digitales.
Fuente: TechCrunch
Waymo va a la autopista: ¿podrá manejar la velocidad? | The Verge

Waymo ha comenzado a incluir recorridos por autopistas en sus rutas de robotaxis en Phoenix, San Francisco y Los Ángeles. Además, ahora ofrece servicio al Aeropuerto Internacional de San José, siendo este el segundo aeropuerto después de Phoenix donde opera. Históricamente, sus vehículos han evitado las autopistas, prefiriendo rutas más largas por calles locales. Sin embargo, esto ha alargado los tiempos de viaje y ha llevado a Waymo a acelerar sus planes de incluir viajes por autopistas tras extensas pruebas.
Por ahora, solo los usuarios de acceso anticipado pueden usar esta nueva función de autopista, que se ampliará en base a datos de rendimiento y retroalimentación de los usuarios. Se espera que estos avances mejoren las calificaciones de los pasajeros, ya que los viajes por autopista pueden reducir los tiempos hasta en un 50%. Waymo ha coordinado sus operaciones con las autoridades locales para garantizar el cumplimiento normativo, y su capacidad para dominar el manejo en autopistas será crucial para su crecimiento y ventaja competitiva.
Fuente: The Verge
MMCTAgent: Permitiendo el Razonamiento Multimodal en Grandes Colecciones de Videos e Imágenes

MMCTAgent es un innovador sistema desarrollado por Microsoft Research que facilita el razonamiento multimodal dinámico. Este sistema está basado en el marco AutoGen de Microsoft, combinando el procesamiento del lenguaje, la percepción visual y el entendimiento temporal para abordar tareas complejas como el análisis de videos largos y colecciones extensas de imágenes.
Gracias a su capacidad para integrar diversos tipos de información, MMCTAgent puede comprender el contexto y el significado de formas que otros sistemas tradicionales pueden encontrar difíciles. Esta tecnología es particularmente valiosa en escenarios como la vigilancia de seguridad, la moderación de contenidos y el análisis de medios, donde los datos visuales y temporales son cruciales. Esta herramienta promete significativos avances en el procesamiento e interpretación de medios a gran escala.
Fuente: Microsoft Research
NVIDIA Gana Todos los Benchmarks de MLPerf Training v5.1

NVIDIA ha marcado un hito al ganar en todas las pruebas del MLPerf Training v5.1, un conjunto de evaluaciones estándar en la industria para medir el rendimiento del entrenamiento en inteligencia artificial. La compañía logró los tiempos de entrenamiento más rápidos en modelos de lenguaje de gran tamaño, generación de imágenes, sistemas de recomendación, visión por computadora y redes neuronales gráficas. Este logro destaca la eficiencia de NVIDIA en la formación de modelos más inteligentes en la era de la inteligencia artificial.
Los resultados impresionantes se lograron gracias al uso del sistema GB300 NVL72, impulsado por la arquitectura Blackwell Ultra de NVIDIA. Esta nueva tecnología permitió un rendimiento significativamente mejorado en comparación con generaciones anteriores, e incluso estableció un tiempo récord de entrenamiento para el modelo Llama 3.1 405B en solo 10 minutos. Además, la precisión de NVFP4 utilizada en los cálculos fue clave para alcanzar estos resultados sin precedentes.
Fuente: NVIDIA Blog



