GOOGLEN TEKOÄLY 'ALPHA GO ZERO' JUURI PAINETTU PALAUTA MITEN OPPIA

Muistatko (epämääräisesti), kuinka opit kävelemään, puhumaan, pyörällä tai ajamaan? Se oli sotkuinen ja täynnä virheitä, mutta tällä tavalla oppimasi taidot pysyivät. Elävien järjestelmien ulkopuolella on ollut haastavaa rakentaa riittävän vahvoja algoritmeja 'todellisen elämänkokemuksen' hyödyntämiseksi ja tahmean, sopeutuvan käyttäytymisen kehittämiseksi tekoälyä varten.

No, Alpha Go Zero vain teki sen.

'Se alkaa tyhjältä taululta ja selviää vain itselleen, vain itsepelistä ja ilman mitään inhimillistä tietoa tai mitään ihmisdataa, piirteitä, esimerkkejä tai ihmisten väliintuloa. Se löytää Go-pelin pelaamisen ensimmäisistä periaatteista '', sanoo DeepMindin professori David Silver.

Tekoälyllä on ollut useita iteraatioita, joista kukin on älykkäämpi ja kykenevämpi kuin aiemmin. Edellisessä versiossa käytettiin valtavaa tietokantaa aiemmista peleistä joukon algoritmeja, jotka osoittivat sen voittoon. Tämä lähestymistapa johti hallitsevan maailmanmestarin Go-pelaajan tappioon. Pokerissa AI Libratus nylki äskettäin maailman parhaat pokerinpelaajat lähes 2 miljoonalla dollarilla, myös oppimalla itseään ihmisten pelitietojen sijaan.

mikä on prinsessarakkauden kansallisuus

Nyt, tässä uusimmassa versiossa Alpha Go, tekoälyohjelma opetti itse kuinka pelata Go - ilman inhimillistä taustaa.

Miljoonien pelisimulaatioiden suorittaminen itseään vastaan kesti 40 päivää, ennen kuin se oppi - tyhjästä - kuinka voittaa itsensä maailmanmestari-versio. Se on todella muuttuvaa peliä paitsi Go: n kannalta myös sen suhteen, miten uusi tieto löydetään. Kuinka tarkka tai täydellinen on verkkotunnuksesi asiantuntemus? Siellä on paljon enemmän löydettävää, kertoo tämä kiehtova kokeilu oppimisessa Alpha Go Zeron kanssa.

'' Alpha Go: n idea ei ole mennä ulos ja kukistaa ihmisiä, vaan itse asiassa selvittää, mitä tarkoittaa tieteen tekeminen - jotta ohjelma voi oppia itseltään, mitä tieto on '', Silver sanoo YouTube-julkaisussa saavutus.

Alpha Go Zero Deep Mind -tiimi kutsuu sitä ensisijaiseksi oppimiseksi 'tabula rasa' (tyhjä liuskekivi) -oppimiseksi.

'Jos pystyt saavuttamaan tyhjä taulu oppimisen avulla sinulla on agentti, joka voidaan siirtää Go-pelistä mihin tahansa muuhun verkkotunnukseen, ja pelin erityispiirteet keksit niin yleisen algoritmin, jota voidaan käyttää missä tahansa '', hän sanoo . Se on provosoiva ajatus, kun laajennat konseptia. Ajatelkaapa, mitä voisimme tehdä joukolla vahvoja, oppivia algoritmeja, jotka voisivat järjestelmällisesti ratkaista vaikeita ongelmia ja oppia nopeammin kuin sivilisaation kollektiivinen tieto. . . päivinä, ei vuosikymmeninä.

melissa benoist syntymäaika

Toistaiseksi iso poisto on, 'algoritmeilla on paljon enemmän merkitystä kuin joko laskennalla tai käytettävissä olevalla datalla', Silver sanoi. Pelkästään tämä on pelinvaihtaja siinä, miten lähestymme tunnetun maailman laajentamista. Vaikka Alpha Go käyttää noin 25 miljoonan dollarin laitteistoa - se ei ole aivan kevyt järjestelmä - tiedät, että tekoäly-gurut ovat jo pitkään työskennelleet puhtaampien, parempien tietojoukkojen luomisessa. Nykyään monia suuria tietojoukkoja pidetään liian meluisina - täynnä huonoja tietoja - tekoälyn kouluttamiseksi tarkasti. Jos tekoäly oppii tiedoista ja data on huono, se ei opi. Iso ongelma.

Entä jos et tarvitsisi puhdasta tietoa, vaan vain kokemusta, ja tekoäly voisi kouluttaa itseään?

Se on jännittävä saavutus Alpha Go Zerossa. Vaikka se onkin kapealla, sääntöpohjaisessa pelimaailmassa, sillä on suuria vaikutuksia kaikilla fyysisiä sääntöjä käsittelevillä aloilla - ajattele kemiaa, liikennettä, biologiaa, farmakologiaa, matkustamista, logistiikkaa ja valmistusta. Jos voimme suunnitella niin joustavia sääntöjä, että ne voivat työskennellä laajemman kokemuksen perusteella ja niin suuntautuneina, että ne luovat aina vahvempia taitoja - kuten Alpha Go Zero -, on mahdollista saavuttaa tekoäly, joka ohjaa järjestelmiä. Nämä järjestelmät eivät tarvitse ulkopuolisia tietoja, niillä ei ole tietojen puhdistusongelmia eivätkä ne tarvitse silmukan hidastumista silmukassa. Osittain siksi Googlen emoyhtiö Alphabet lyö vetoa yritykselle tekoälystä ja investoi tekoälyyn nopeasti. (Amazon investoi myös tekoälyyn, kuten uusin tekoälyn hankinta BodyLabs.)

kuinka pitkä tom petty oli

Syvämielinen professori David Silver sanoo: 'Sen tosiasian, että olemme nähneet ohjelman saavuttavan korkean tason suorituskyvyn ... pitäisi tarkoittaa nyt, että voimme alkaa torjua joitain ihmiskunnan haastavimpia ja vaikuttavimpia ongelmia'.

Tätä viestiä on päivitetty selventämään, että AI Libratus voitti äskettäin parhaat pokerinpelaajat käyttämällä strategiaa, joka sisältää itse pelaamisen eikä ihmisen syöttämiä tietoja.