A Google egy friss blogbejegyzésben beszél a nyílt forráskód és a nyílt adatok fontosságáról

Tech / A Google egy friss blogbejegyzésben beszél a nyílt forráskód és a nyílt adatok fontosságáról 3 perc olvasás

Google



A Google mint vállalat mindig támogatta a nyílt forráskódú szoftvereket és adatokat, legalábbis a standjukon. A nagyvállalatoknál ez már szinte trend, mivel mind a Google, mind a Microsoft kiemelkedően hozzájárult a nyílt forráskódú színtérhez. „ A Google emellett a nyílt forráskódú szoftverek egyik fő munkatársa. Ennek legfontosabb példái a következők Android , okostelefon operációs rendszerünk, Króm , a Chrome böngészőnk kódalapja (most is sok versenytársat táplál ), és TensorFlow , gépi tanulási rendszerünk. A Google kiadása Kormányzók örökre megváltoztatta a felhőalapú tárhelyet, és lehetővé tette az innovációt és a versenyt a felhőiparban. A Google emellett a legnagyobb a nyílt forráskódú közreműködő GitHub , megosztott tárház a szoftverfejlesztéshez. 2017-ben a Google munkatársai több mint 250 000 módosítást hajtottak végre több tízezer projektben csak a GitHubon. '

A legtöbb esetben valójában nem nagylelkűségből, hanem inkább a szabad fejlesztés előnyeiből, majd a széles körű elfogadásból profitálnak. Ettől függetlenül ezek a hozzászólások több ezer kutatónak segítettek, és egységes módon irányították a szoftverfejlesztést, amelyet meg kell ünnepelni. A Google egy nemrégiben közzétett blogbejegyzésében kiemelte hozzájárulását a nyílt adatokhoz és a nyílt forráskódú szoftverekhez.



A valós idejű követés megjelenésével és a vezető nélküli autók fejlesztésével rengeteg kutatás folyik a számítógépes látás terén, és a Google az egyik vállalat a Visual Tech élvonalában.



A nyílt forráskódú és nyílt adatok iránti elkötelezettségünk arra késztetett bennünket, hogy mindenkivel megosszuk az adatkészleteket, szolgáltatásokat és szoftvereket. Például a Google kiadta a Nyissa meg a Képek adatkészletet 36,5 millió képből, amelyek közel 20 000 kategóriát tartalmaznak emberi címkével. Ezekkel az adatokkal a számítógépes látáskutatók képfelismerő rendszereket képezhetnek. Hasonlóképpen, a millió kommentált videó a YouTube-8M gyűjtemény felhasználható a videófelismerés képzésére.



- Variáns dolog

Vezető közgazdász, Google

A Google emellett rengeteg olyan adatot is kezel, amelyek segíthetnek az NLP kutatásában, és a számítógépek jobban megérthetik az emberi beszédet. A blogbejegyzésben a Google kiemelte egy kulcsfontosságú adatbázis megosztását, A nyelvi feldolgozás tekintetében megosztottuk a Természetes kérdések adatbázis, amely 307 373 ember által generált kérdést és választ tartalmaz. Elérhetővé tettük a Ezermilliárd szó korpusz , amely a nyilvános weboldalakon használt szavakon alapul, és a Ngram Viewer , amely felhasználható a több mint 25 millió könyv feltárására Google Könyvek . Ezek a gyűjtemények felhasználhatók statisztikai gépi fordítás , beszédfelismerés, helyesírás-javítás , entitásérzékelés, információ kinyerés és egyéb nyelvkutatás. ”



A keresőmotor a Google egyik fő vállalkozása, másodpercenként több mint 63 000 lekérdezést kap. Ezek az adatok nagyon fontosak a vállalat számára, és a Google elemzi ezeket az adatokat a célzott hirdetések érdekében. Ennek ellenére az összes adattal kapcsolatos betekintést a Google trendportálján tesznek nyilvánossá.

' A Google is kínál Google Trends , egy ingyenes szolgáltatás, amely lehetővé teszi, hogy bárki megtekinthesse és letölthesse az összesített keresési tevékenységet 2004 óta a Google Keresés, a Képkereső, a Hírkereső, a Shopping és a YouTube számára. Havi, heti, napi és akár óránkénti keresési információkat kaphat országok, régiók, metróövezetek és városok számára. A Trends adatait a kutatók széles körben használják olyan változatos területeken, mint az orvostudomány és a közgazdaságtan. A Google Tudós szerint vannak több mint 21 000 kutatási cikk amely a Trends-t idézi adatforrásként. ”

Miért dolgozzon nyílt forráskódú projekteken?

A cikk elején röviden beszéltem erről. Egy új szoftver képes megvalósítani egy nagyszerű ötletet és megújítani a teret, de ez nem akadályozza meg másokat abban, hogy hasonló ötleteket valósítsanak meg, majd azon dolgoznak, hogy jobbá tegyék azokat. Sok vállalat megtanulta ezt a kemény utat, például a Windows Phone. Mint tudjuk, ez egy hatalmas kudarc volt, sok okból kifolyólag, de a zárt környezet és az engedélyek ellenőrzése ennek nagy része volt. A Hardoop és a HDFS a Google által épített MapReduce nyílt forráskódú verziói voltak, és a vállalat már korán megtanulta a nyílt forráskódú jelentőségét. Összefoglalva: az IP nyílt forráskódú stratégiai döntés.

A Google blogbejegyzésében néhány egyéb okot is elmélyít, kijelentve: Első és legfontosabb feladatunk „a világ információinak rendszerezése, és általánosan hozzáférhetővé és hasznosá tétele”. Az információk nyilvánvaló hozzáférhetővé és hasznossá tételének nyilvánvaló módja az eladás ! '

Beszélnek arról is, hogy miért nem tudnak kiadni néhány dolgot, Természetesen nem adhatjuk ki az üzleti tevékenységünk során használt összes adatot. Védenünk kell a felhasználók adatait, meg kell őriznünk az üzleti ügyfelek bizalmasságát, és meg kell védenünk a Google saját szellemi tulajdonát. De ilyen megfontolások figyelembevételével általában megpróbáljuk adatainkat a lehető „általánosan hozzáférhetővé és hasznosabbá” tenni. '

Címkék Google