Google I/O 2025 konverentsil tutvustas ettevõte revolutsioonilist multimodaalse mudeli Gemini 2.5 versiooni, mis toetab emotsionaalset häälsuhtlust ja reaalajas heli genereerimist.
G. Ostrov
Google tutvustas oma aastastel I/O 2025 konverentsil märkimisväärset tehisintellekti Gemini 2.5 uuendust, mis muudab põhjalikult lähenemist häälsuhtlusele AI-ga. Uus mudel Gemini 2.5 Flash Preview suudab nüüd mitte ainult mõista kasutaja kõne emotsionaalset värvi, vaid ka kohandada oma vastuseid vastavate intonatsioonide ja emotsionaalse väljendusrikkusega.
Emotsionaalse AI võtmevõimalused
Gemini 2.5 revolutsioonilised funktsioonid hõlmavad emotsioonide äratundmist vestluspartneri häälest ning võimet genereerida vastuseid sobiva emotsionaalse värvinguga. Mudel suudab kohandada mitte ainult intonatsiooni, vaid ka aktsenti, tagades loomuliku suhtluse üle 24 keeles. Süsteem suudab ignoreerida taustahelisid ja integreeruda väliste tööriistadega, nagu Google otsing, et saada ajakohast teavet otse dialoogi ajal.
Laiendatud kõnesünteesi funktsioonid
Erilist tähelepanu pöörasid arendajad tekst-kõne (TTS) võimalustele. Gemini 2.5 võimaldab kasutajatel täpselt kontrollida häälestamise stiili, kõne tempot ja emotsionaalset väljendusrikkust. Lisaks toetab mudel mitme häälega dialoogide genereerimist, mis avab uued horisondid podcastide, audioraamatute ja muude multimeedia projektide loomiseks.
SynthID läbipaistvuse tehnoloogia
Eetilise läbipaistvuse tagamiseks märgistatakse kõik Gemini 2.5 loodud helimaterjali automaatselt SynthID tehnoloogiaga. See võimaldab kergesti tuvastada sisu kui tehisintellekti genereeritud, mis on kriitiliselt oluline deepfake\'ide ja sünteetilise meedia ajastul.
Kättesaadavus arendajatele
Uued võimalused on arendajatele kättesaadavad eelversioonis Google AI Studio ja Vertex AI platvormide kaudu. Funktsioonide testimist saab läbi viia spetsiaalsete Stream ja Generate Media vahelehe kaudu Google AI Studios.
Gemini 2.5 esindab märkimisväärset läbimurret multimodaalsete AI süsteemide valdkonnas, ühendades teksti, pilte, heli ja videot ühtseks intelligentseks platvormiks. Need innovatsioonid avaavad laiad perspektiivid interaktiivsete rakenduste, virtuaalsete assistentide ja revolutsiooniliste lahenduste loomiseks hariduse valdkonnas.
Google AI ja selle toodete kohta saab rohkem teada Google AI ametlikul veebilehel.
Probleemide korral kirjutage meile, aitame kiiresti ja kvaliteetselt!