Das KI-Startup ElevenLabs hat seine Text-to-Speech-App Reader nun weltweit auf den Markt gebracht. Die App unterstützt 32 Sprachen und ermöglicht es Nutzern, sich Texte wie Artikel, PDFs und E-Books in verschiedenen Sprachen und Stimmen vorlesen zu lassen. Die App wurde im Juni zunächst in den USA, Großbritannien und Kanada eingeführt. Das Unternehmen bietet auch eine API für verschiedene Geschäftsanwendungen und integriert seine Technologie in Plattformen wie Perplexity und PocketFM.
Google hat begonnen, Assistant-Abläufe in seinen neuen KI-basierten Assistenten Gemini zu integrieren. Dies soll es Nutzern ermöglichen, Routinen über Sprachbefehle auf Android-Smartphones auszulösen. Erste Tests zeigen jedoch gemischte Ergebnisse: Während einige Nutzer die Funktion in den Einstellungen bereits aktiviert haben, berichten andere, dass die Befehle zwar angenommen, aber nicht ausgeführt werden. Die entsprechende Option findet sich unter “Google Gemini > Einstellungen > Google Assistant-Funktionen in Gemini > Abläufe”.
Die US-Firma Figure hat den humanoiden Roboter Figure 02 angekündigt, der durch eine Partnerschaft mit OpenAI sprechen kann. Der Roboter ist mit Lautsprechern und Mikrofonen ausgestattet, um mit Menschen zu kommunizieren, was auch die Sicherheit erhöht. Die Hände des Roboters wurden neu gestaltet, um menschlicher zu wirken und einen sicheren Griff zu gewährleisten. Figure 02 soll in Fabriken und Lagern eingesetzt werden und ist auch für den Haushaltsgebrauch geeignet.
Das KI-Startup Suno hat offen zugegeben, urheberrechtlich geschützte Songs der drei großen Musiklabels Universal Music Group, Warner Music Group und Sony Music Group für das Training seines KI-Modells verwendet zu haben. Suno verteidigt sein Vorgehen mit dem Argument, das Scrapen von Songs sei als Fair Use anzusehen, da die kopierten Werke lediglich für technische Prozesse verwendet würden. Die klagende Recording Industry Association of America (RIAA) hält Sunos Vorgehen für „irreführend“.
OpenAI hat eine erste Version seines neuen Sprachassistenten für ausgewählte ChatGPT-Plus-Abonnenten freigegeben. Das Update wurde erstmals im Mai vorgestellt und soll ChatGPT in die Lage versetzen, Spracheingaben besser zu verstehen und darauf zu reagieren, einschließlich der Erkennung unterschiedlicher Tonlagen und der Reaktion auf Gesprächsunterbrechungen. Insgesamt präsentierte OpenAI die fünf Sprachoptionen Breeze, Cove, Ember, Juniper und Sky. Letztere erregte wurde nach Kritik wieder entfernt.
OpenAI hat das neue Modell GPT-4o Mini vorgestellt, ein kostengünstigeres und leistungsfähigeres Modell als GPT-3.5, das speziell für Entwickler entwickelt wurde. Es bietet laut Hersteller eine preiswerte Alternative zu teureren Modellen, die hohe Rechenkosten verursachen. Das Modell soll in Zukunft auch multimodale Ein- und Ausgaben unterstützen, einschließlich Video und Audio. Mit 82 Prozent im MMLU-Test für Sprachverständnis übertrifft es ältere Modelle wie GPT-3.5 und konkurriert mit anderen aktuellen Modellen wie Gemini Ultra von Google.
Spotify hat ein neues Update für seinen KI-DJ veröffentlicht, das nun auch Spanisch unterstützt. Diese Funktion ermöglicht es Benutzern, personalisierte Playlists und Musikeinführungen in spanischer Sprache zu genießen. Das Update zielt darauf ab, die Benutzererfahrung zu verbessern und eine breitere Zielgruppe anzusprechen. Nutzer können jetzt einfach zwischen verschiedenen Sprachen wechseln und die neuen Funktionen in ihrer Spotify-App ausprobieren.
Der niederländische E-Bike-Hersteller VanMoof, der nach Insolvenz unter neuer Leitung steht, versucht das Vertrauen der verprellten Kunden zurückzugewinnen. Wer vor der Insolvenz ein E-Bike bestellt, aber nie erhalten hat, bekommt nun einen Gutschein über 1.000 Euro beim Kauf eines bestehenden oder zukünftigen VanMoof-Bikes. Das Angebot gilt bis Ende 2027. Betroffene Kunden müssen sich mit der E-Mail-Adresse registrieren, mit der sie das erste E-Bike bestellt haben.
DeepL hat seine Geschäftslösung DeepL Pro für KI-Sprachtechnologie in 165 zusätzlichen Märkten eingeführt und ist damit nun in insgesamt 228 Märkten präsent. Die Expansion erstreckt sich über verschiedene Regionen, darunter APAC, Afrika, Europa, Nord- und Südamerika und sogar die Antarktis. Die internationale Expansion soll laut CEO Jarek Kutylowski dazu beitragen, die Arbeitsweise globaler Unternehmen neu zu definieren.
Das AI-Startup Mistral AI und das größte private KI-Labor Europas, Silo AI, haben eine Partnerschaft angekündigt. Gemeinsam bieten sie ein kombiniertes KI-Angebot, das Mistral AIs Large Language Models und Silo AIs End-to-End-KI-Fähigkeiten umfasst. Ziel ist es, Unternehmen mit maßgeschneiderten KI-Lösungen zu unterstützen und die Einführung komplexer generativer KI-Technologien zu beschleunigen. Beide Unternehmen nutzen ihre komplementären Stärken, um innovative Lösungen für ihre Kunden zu schaffen.