Aleph Alpha hat seine Geschäftsstrategie geändert: Statt sich im globalen Wettbewerb um die Entwicklung der besten Sprachmodelle zu behaupten, konzentriert sich das Unternehmen nun darauf, seinen Kunden den Einsatz von KI in Geschäftsprozessen zu erleichtern. Laut Experten und Investoren ist diese Entscheidung eine Anpassung an die sich schnell verändernde Landschaft der KI-Technologien, in der die Replikation bestehender Modelle einfacher und kostengünstiger wird.
Das KI-Startup ElevenLabs hat seine Text-to-Speech-App Reader nun weltweit auf den Markt gebracht. Die App unterstützt 32 Sprachen und ermöglicht es Nutzern, sich Texte wie Artikel, PDFs und E-Books in verschiedenen Sprachen und Stimmen vorlesen zu lassen. Die App wurde im Juni zunächst in den USA, Großbritannien und Kanada eingeführt. Das Unternehmen bietet auch eine API für verschiedene Geschäftsanwendungen und integriert seine Technologie in Plattformen wie Perplexity und PocketFM.
Google hat begonnen, Assistant-Abläufe in seinen neuen KI-basierten Assistenten Gemini zu integrieren. Dies soll es Nutzern ermöglichen, Routinen über Sprachbefehle auf Android-Smartphones auszulösen. Erste Tests zeigen jedoch gemischte Ergebnisse: Während einige Nutzer die Funktion in den Einstellungen bereits aktiviert haben, berichten andere, dass die Befehle zwar angenommen, aber nicht ausgeführt werden. Die entsprechende Option findet sich unter “Google Gemini > Einstellungen > Google Assistant-Funktionen in Gemini > Abläufe”.
SAP entwickelt eine neue KI speziell für die Analyse und Verarbeitung von Geschäftszahlen. Laut Technologievorstand Jürgen Müller will das Unternehmen mit dem „SAP Foundation Model“ als erster Anbieter ein tabellenorientiertes KI-Modell auf den Markt bringen. Dieses Modell soll insbesondere bei der Vorhersage von Umsätzen, Lieferantenloyalität und Zahlungsverhalten überlegen sein. In einem Interview sagte Müller, erste interne Tests zeigten, dass das SAP-Modell bereits besser sei als das führende Sprachmodell GPT-4 von OpenAI.
Das KI-Startup xAI, das von Elon Musk geleitet wird und zuletzt 6 Milliarden US-Dollar erhalten hat, hat sein neues Modell Grok-2 sowie eine kleinere Version Grok-2 mini vorgestellt. Diese neuen Modelle ermöglichen es Nutzern, Bilder relativ frei zu erstellen, was Fragen hinsichtlich der Inhaltsrichtlinien aufwirft. So zeigte der KI-Entwickler Benjamin De Kraker provokante Beispiele, bei denen Grok-2 Bilder von Donald Trump und George W. Bush in kontroversen Szenarien generierte.
Opera hat seinen auf KI ausgerichteten Browser „Opera One“ nun auch für iOS veröffentlicht. Der Browser integriert die Aria-KI-Assistentin, die nun auch Sprachbefehle unterstützt und Bilder mit Googles Imagen2-Modell generieren kann. Die Benutzeroberfläche ist für mobile Geräte optimiert, und Funktionen wie eine anpassbare Suchleiste und ein integrierter Werbeblocker sowie ein kostenloses VPN bieten zusätzlichen Komfort und Sicherheit.
Die US-Firma Figure hat den humanoiden Roboter Figure 02 angekündigt, der durch eine Partnerschaft mit OpenAI sprechen kann. Der Roboter ist mit Lautsprechern und Mikrofonen ausgestattet, um mit Menschen zu kommunizieren, was auch die Sicherheit erhöht. Die Hände des Roboters wurden neu gestaltet, um menschlicher zu wirken und einen sicheren Griff zu gewährleisten. Figure 02 soll in Fabriken und Lagern eingesetzt werden und ist auch für den Haushaltsgebrauch geeignet.
OpenAI hat eine neue Demo des fortgeschrittenen Sprachmodus von ChatGPT vorgestellt, der vielfältige Akzente und Sprachen unterstützt. Diese Funktion soll die Interaktion mit der KI natürlicher und vielseitiger gestalten. Der neue Sprachmodus ermöglicht es Nutzern, ChatGPT nicht nur Textbefehle zu geben, sondern auch durch gesprochene Befehle in verschiedenen Sprachen und Akzenten zu kommunizieren, was die Benutzerfreundlichkeit erheblich verbessert.
Im Preiskampf rund um generative KI hat Mistral AI die Kosten für sein neuestes Modell gesenkt, so dass es nun preislich mit Modellen wie Claude Sonnet 3.5 von Anthropic vergleichbar ist und sogar unter den Kosten des GPT-4o von OpenAI liegt. Parallel dazu hat Meta eine aggressive Open-Source-Strategie mit seinem Modell Llama 3.1 eingeführt, das kostenlos zur Verfügung steht und von jedermann genutzt werden kann, auch wenn es kommerzielle Einschränkungen gibt.
Für Aleph Alpha trifft diese Nachricht genau zur rechten Zeit ein: Baden-Württemberg will mit einer KI-basierten Software von Aleph Alpha Verwaltungsprozesse beschleunigen. Der Einsatz der Technologie soll ab Mitte August beginnen und schrittweise umgesetzt werden, kündigte Staatsminister Florian Stegmann in Heilbronn an. Ort der Bekanntgabe war der Innovationspark Künstliche Intelligenz (Ipai), der künftig Europas größter Campus für diese Technologie werden soll. Die KI-Software, die Aleph Alpha in Kooperation mit dem landeseigenen Innovationslabor Innolab entwickelt hat, soll Beamte vor allem bei der Recherche unterstützen. Die KI-Lösung enthält Sprachmodelle, die Texte und Bilder interpretieren können, ähnlich wie ChatGPT von OpenAI. Eine Besonderheit der Software ist ihre Erklärungsfunktion, die Aleph-Alpha-Chef Jonas Andrulis hervorhebt. Diese Funktion verhindere die Generierung falscher Informationen durch die KI, ein bekanntes Problem aktueller Modelle. Für Aleph Alpha ist die Einführung der Software der erste Schritt zu einem umfassenden KI-basierten Management. Dieses Geschäftsfeld soll in Zukunft eines der Hauptstandbeine des Unternehmens werden.