Három új USE többnyelvű modul érkezik a TensorFlow-hoz

Tech / Három új USE többnyelvű modul érkezik a TensorFlow-hoz 2 perc olvasás

Google Voice Search



A Google az AI kutatás egyik úttörője, és projektjeik sokasága megfordult. AlphaZero a Google-tól DeepMind csapat áttörést jelentett az AI kutatásban, annak köszönhetően, hogy a program képes önmagában bonyolult játékokat megtanulni (emberi képzés és beavatkozás nélkül). A Google is kiváló munkát végzett Természetes nyelv feldolgozó programok (NLP), ami a Google Segéd hatékonyságának egyik oka az emberi beszéd megértésében és feldolgozásában.

A Google nemrég jelentette be három új kiadását HASZNÁLjon többnyelvű modulokat és több nyelvű modellt kínál a szemantikailag hasonló szöveg lekérésére.



Az első két modul többnyelvű modelleket kínál a szemantikailag hasonló szöveg lekérésére, az egyiket a visszakeresési teljesítményre optimalizálták, a másikat a sebességre és a kevesebb memóriahasználatra. A harmadik modell a következőkre specializálódott kérdés-válasz visszakeresés tizenhat nyelven (USE-QA), és egy teljesen új USE alkalmazást jelent. Mindhárom többnyelvű modul a többfeladatos kettős kódoló keretrendszer , hasonlóan az eredeti angol nyelvű USE modellhez, miközben a kettős kódoló additív margin softmax megközelítéssel . Nemcsak a jó transzfer tanulási teljesítmény fenntartására tervezték őket, hanem jól szemantikus visszakeresési feladatokat is ellátnak.



A nyelvek feldolgozása a rendszerekben hosszú utat tett meg, az alapszintaktikai fa elemzésétől a nagy vektor asszociációs modellekig. A szöveges szövegkörnyezet megértése az NLP mezőnyben az egyik legnagyobb probléma, és az Universal Sentence Encoder ezt megoldja a szöveg nagydimenziós vektorokban történő konvertálásával, ami megkönnyíti a szöveg rangsorolását és denotálását.



UTE jelölési struktúra forrása - Google Blog

A Google szerint „ A három új modul mind szemantikus visszakeresési architektúrára épül, amely jellemzően külön neurális hálózatokra bontja a kérdések és válaszok kódolását, ami lehetővé teszi a lehetséges válaszok milliárdjai közötti keresést milliszekundumon belül. Más szóval, ez segít az adatok jobb indexelésében.

' Mindhárom többnyelvű modul a többfeladatos kettős kódoló keretrendszer , hasonlóan az eredeti angol nyelvű USE modellhez, miközben a kettős kódoló additív margin softmax megközelítéssel . Nemcsak a jó transzfer tanulási teljesítmény fenntartására tervezték őket, hanem jól szemantikus visszakeresési feladatokat is ellátnak . ” A Softmax függvényt gyakran használják a számítási teljesítmény megtakarítására vektorok hatványozásával, majd minden elem elosztásával az exponenciális összeggel.



Szemantikus visszakeresési architektúra

„A három új modul mind szemantikus visszakeresési architektúrákra épül, amelyek jellemzően külön neurális hálózatokra bontják a kérdések és válaszok kódolását, ami lehetővé teszi a potenciális válaszok milliárdjai közötti keresést milliszekundumon belül. A kettős kódolók hatékony szemantikai visszakereséséhez a legfontosabb az, hogy az összes jelölt választ előre kódoljuk a várható bemeneti lekérdezésekre, és egy vektor adatbázisban tároljuk, amely a legközelebbi szomszéd probléma , amely lehetővé teszi a jelöltek nagy számának gyors, jó keresését pontosság és visszahívás . '

Ezeket a modulokat letöltheti a TensorFlow Hub webhelyről. További információkért olvassa el a GoogleAI teljes oldalát blog bejegyzés .

Címkék Google