scale= showall> </embed> </object>
 

Um gervigreind og reynslu IT ráðgjafar á því sviði

Vinnslugeta og minni hafa verið og eru enn þröskuldar í þróun gervigreindar, þó hefur tæknin leyft okkur að þróa takmörkuð kerfi sem hafa þegar haft gríðarleg áhrif, kerfi sem læra, hugsa og hegða sér skynsamlega í takmörkuðu umhverfi. Fyrir um 5 árum gaf Ray Kurzweil bókina “The age of spiritual machines” í henni áætlar hann að venjuleg einkatölva muni ná vinnslugetu mannsheila eða um  reikniaðgerðum á sekúndu fyrir árið 2019. Einkatölvur í dag ná u.þ.b. reiknigetu. Öflugasta tölva veraldar er IBM BlueGene/L, hún hefur 32.768 örgjöfra og skilar u.þ.b.. Öflugasta PC vél veraldar er Orion DC-96, hún framkvæmir rúmlega reikniaðgerðir á sekundu. Kurzweil byggir á kenningu sinni um að þróunin verði hraðari en hið þekkta lögmál Moore og færir sterk rök fyrir því. Þessi öra þróun og aðgengi upplýsinga gefur þeim sem vinna við gervigreind tækifæri til þess að glíma við flóknara umhverfi og loks yfirstíga greind manna. Við gætum fengið að upplifa það sem frumkvöðlar gervigreindar dreymdu um. Ég ræddi við Kurzeeil um daginn og spurði hann um stöðu mála, hvort hann telur enn að áætlanir hans muni standast. Við fórum lítillegar í gegnum áætlanir hans fyrir 2009 og vorum sammála um að þróunin væri enn eins og hann hafi séð fyrir. Kurzweil gaf út nýja athygliverða bók fyrir skömmu sem ber sama titil og gömul vísindaskáldsaga efir Richard O. Fleischer frá 1966 eða "Fantastic Voyage", þar lýsir hann ásamt Terry Grossman hvernig þeir sem verða á lífi eftir um 50 ár, geta lifað nær endalaust. Þetta er ekki vísindaskáldsaga.

Minn þáttur í gervigreind undanfarin ár hefur snúist um notkun gervitauganeta við mynsturleit. Slík kerfi læra af reynslunni og nota þann lærdóm til þess að áætla niðurstöður nýrra gagna þó þau séu töluvert frábrugðin þeim gögnum sem notuð voru til þess að kenna kerfinu, þ.e. þau hafa öðlast skynsemi í gegnum þekkingu á fortíðinni til þess að taka ákvörðun út frá breyttum forsendum. Í því fellst styrkur slíkra kerfa. Tauganet af þessu tagi hafa reynst vel við leit að kortamisferlum, peningaþvætti, bókhaldssvikum, tryggingasvikum, verðbréfaviðskiptum, myndgreiningum, hljóðgreiningu, umhverfisrannsóknir, anditsgreiningu, rithandargreiningu og ekki síst við rannsóknir þar sem mynsturleit er snar þáttur.

En lítum aðeins á sögu gervigreindar og tauganeta.

Sumarið 1956 komu saman til tveggja mánaða vinnufundar í Dartmounth í Bandaríkjunum tíu manns. Tilgangur vinnufundarins var að koma saman þeim vísindamönnum sem sem höfðu áhuga á tauganetum og rannsóknum á greind. Fundurinn var að frumkvæði John McCarthy sem þá hafði nýlokið meistaranámi frá Princeton og vann nú við Dartmouth College.

Þátttakendur voru: John McCarthy frá Princeton, Marvin Minsky frá Princeton,Claude Shannon, Bell labaratories, Nathaniel Rochester frá Princeton, Trenchard More frá Princeton, Arthur Samuel frá IBM, Ray Solomonoff frá MIT, Oliver Selfridge frá MIT,  Allen Newell frá CMU, Herbert Simon frá CMU.

Þessi fundur markar faglegt upphaf gervigreindar og kynnir til sögunar þá menn sem standa í fylkingarbrjósti gervigreindar næstu 20 árin á eftir. þar kemur McCarthy fyrst fram með fagheitið “Artificial Intelligence” eða gervigreind eins og það er nefnd á Íslensku. Á fundinum kynntu Newell og Simon LT (the Logic Theorist)  og sögðu um það að þeir hefðu fundið með því forrit sem væri þess megnugt að hugsa ónúmerískt og þar með aðskilið huga frá líkama. Stór orð en sönn ef við reynum að aðskilja tilfinningalegri hugsun frá hugsun sem snýr að vinnslu upplýsinga.

Þó faglegur grunnur  hafi verið lagður að gervigreind á þessum fundi, á gervigreind sér lengri sögu. Fyrsta vísindagreindin sem eignuð er gervigreind var skrifuð 1943 af Warren McCulloch og Walter Pitts. Þeir settu saman kenningar um virkni og uppbyggingu taugafruma í heilanum, kenningar Russell og Whitehead um  yrðingarökfræði og  tölvunarkenningar Alan Turing. Niðurstaða þeirra var model af gervi-taugafrumum sem hver um sig gátu verið í “kveikt” ham eða “slökkt” ham þar sem hami var náð með áreiti tengdra gervi-taugafruma. Þeir sýndu fram á að  niðurstöðu hvaða reiknanlegs falls sem er, mátti ná með neti slíkra gervi-taugafruma. Þeir lögðu einnig til í greininni að slík gervi-tauganet gætu lært, sem Danold Hebb sannaði að var rétt sex árum síðar með einfaldri uppfærslu aðferð á vigt tenginanna á milli eininganna. Marvin Minsky og Dean Edmonds byggðu fyrstu gervi-tauganets tölvuna (SNARC) árið 1951 úr 3000 lömpum og afgangs sjálfstýringu úr B-24 sprengjuflugvélar. Tölvan hafði 40 gervi-tauganetsfrumur (sellur).  Rekja má aðferðafræði bæði samtengingasinna (connectionism) og rökfræðisinna (logicism) innan gervigreindar til skrifa McCulloch og Pitts.

Samtengingasinnar vinna með gervitauganet með það að markmiði að útskýra og hanna greind.

Rökfræðisinnar leitast við að útskýra og hanna greind út frá rökfræðilegum forsendum.

Framanaf ríkti mikil bjartsýni í notkun gervigreindar. Newell og Simon þróuðu LT áfram í  GPS(General Problem Solver) en það kerfi var hannað til þess að líkja eftir atferli manna við lausn vandamála. Herbert Gelenter hannaði GTP (Geometry Theorem Prover) sem sannaði kenningar á grundvelli frumreglna líkt og LT. Gelenter sá fljótlega að rökfræðin bíður upp á of marga mögulegar leiðir sem kanna þurfti í kerfinu og flestar enduðu án niðurstöðu, hann hannaði því aðferðir til þess að flýta leit að niðurstöðu.

Í febrúar 1956 var sýnt í Bandarísku sjónvarpi, tölva sem hafði lært dam. Þar hafði Arthur Samuel hjá IBM afsannað þá kenningu að tölvur gætu aðeins gert það sem þeim var sagt, því þetta forrit hans lærði dam fljótt og lék betur en höfundurinn.

John McCarthy, sem þá var kominn til MIT skrifaði forritunarmálið LISP árið 1958 sem síðar varð vinsællt innan gervigreindar sér í lagi í Bandaríkjunum. Sama ár skrifaði hann grein sem bar yfirskriftina “Programs with Common Sense” og má þar sjá fyrsta fullkomna gervigreindar kerfið á pappír, sem hann nefndi “The Advice Taker”. Kerfið átti líkt og LT og GTP að finna lausnir út frá þekkingu sinni en ólíkt LT og GTP átti kerfið að geta aflað sér þekkingar sjálft og gat jafnframt breytt grundvallarreglum (axioms) ef þurfa þótti og í eðlilegi keyrslu  kerfisins. Aðgangur að tölvum var mjög takmarkaður á þessum tíma, McCarthy og félagar hans hjá MIT fundu því upp “time sharing” sem gjörbylti aðgangsmálum að tölvum, þetta gerist einnig 1958. Þessi hópur og þessi nýja uppfinning varð síðan kveikjan að stofnun “Digital Equipment Corporation”.  McCarthy for hins vegar til Stanford og setti þar á stofn rannsóknarstofu í gervigreind, en sú rannsóknarstofa lagði áherslu á gerð og notkun almennra aðferða við rökfærslu.

Væntingarnar voru miklar, líklega of miklar. Margt að því sem lagt var upp með brást þegar sýna átti árangur. Gott dæmi hvað þetta varðar voru forrit sem áttu að þýða milli tungumála og voru byggð á gervigreind, frægastur er líklega textinn úr ensk-rússnesku þýðingaforrit “the vodka is good but the meat is rotten” sem átti að vera þýðing á “the spirit is willing but the flesh is weak”.  Vandamál af þessu tagi leiddu til þess að skipuð var nefnd á vegum bandaríkjaþings til þess að gera úttekt á árangri af vinnu með gervigreind á þýðingum, í kjölfarið hætti Bandaríkjastjórn að fjármagna rannsólknir á því sviði 1966.

Áður en tíma-flækju kenningar (NP completeness theory) komu fram, var almennt álitið að einungis þrufti að auka afl örgjörfa og auka við innraminni til þess að kerfi gengu í flóknara umhverfi. Í gervigreind vann fólk með mjög takmarkað umhverfi svonefnd “microworld” en þegar umhverfið varð flólknara var ekki nægjalegt að bæta við minni og örgjörfaafli, það tókst ekki að sanna kenningar sem gengu í einfaldara umhverfi, sem er vitaskuld afleitt. Þetta var megin ástæða þess að Bresk stjórnvöld hættu 1973 að styrkja rannsóknir í gervigreind nema að litlu leiti.

Minsky og Papert sögðu í bók sinni Perceptrons sem kom út 1969 að þó tauganet gætu lært allt sem þau gátu lýst, þá gætu þau lýst afar littlu. Þetta olli því að allar rannsóknir á tauganetum lögðust af í áratug. Þeir félagar lýstu í bók sinni afar einföldum netum og áttu niðurstöður þeirra einganvegin við flóknari net, þær voru rangar að því leiti. Það er kaldhæðnislegt að sama ár og Perceptrons kom út, fundu Bryson og Ho upp lærdóms-algorithma (back-propagation) fyrir fjöllaga tauganet sem átti eftir að blása lífi í rannsóknir á tauganetum aftur um 1980. Minsky heggur stundum í greinina, hér er nýlegt dæmi. Hann leyndi ekki skoðunum sínum á Turing verðlaununum. En hvað sem því líður er Minsky tvímælalaust einn af frumkvöðlum gervigreindar þó hann eigi vissulega einnig sök á því að rannsóknir á gervitauganetum lágu niðri í tíu ár. Minsky gagnrýndi að vísu "Lighthill" skýrsluna sem lagði til að Breska ríkið stöðvaði allar fjárveitingar til rannsókna á gervigreind á áttunda áratug síðustu aldar

Fyrstu sérfræðingakerfi (expert systems) litu dagsins ljós upp úr 1970. Það var sérfræðingakerfið Dendral frá þeim félögum í Stanford Ed Feigenbaum, Bruce Buchanan og Joshua Lederberg sem ruddi brautina. Tilgangur þess var að finna mólikúl uppbyggingu út frá upplýsingum um massa. Í kjölfarið fylgdi Mycin, sérfræðingakerfi til þess að finna blóðsýkingar. Feigenbaum og Buchanan nutu aðstoðar Edward Shortliffe við gerð kerfisins. Mycin var frábrugðið Dendral að því leiti að Mycin notaði tilbúnar reglur fengnar frá sérfræðingum í stað þess að vera grundvallað á almennum fræðilegum rökfræðireglum. Mycin var einnig með loðna rökfræði og gat því sagt til um líkur. Líklega er Prospector sérfræðingakerfið einna þekktast frá þessum tíma. Prospector var hannað hjá MRI til þess að finna málmgrýti og reyndist mjög gagnlegt.

Árangur í tungumálaskilningi náðist ekki fyrr en vísindamenn gerðu sér grein fyrir að þekking á viðfangsefninu skiptir sköpum í gervigreind, þegar áherslan fór af verkfærunum og aðferðafræðinni yfir á viðfangsefnið fóru hlutirnir að gerast. Eitt fyrsta sérfræðingakerfið á þessu sviði var SHRDLU en áherslan þar á málfræði reglur sem leiddi til slæmrar þýðingar, það þurfti skilning á viðfangsefninu. Málfræðingurinn Roger Schank hristi upp í vísindamönnum með því að segja að það væri engin málfræði til og skrifaði fjölmörg kerfi þar sem áherslan var á málskilning fyrst og fremst. Með þetta að leiðarljósi skrifaði William Woods Lunar kerfið sem notaði venjulega ensku og var ætlað jarðfræðingum til rannsóknar á grjóti sem Appolo geimflaugin kom með frá tunglinu.

Hugmyndir Japana um “fimmtu kynslóðar tölvuna” 1981 varð að vítamínsprautu fyrir fagið ekki sýst vegna hræðslu annarra um Japönsk yfirráð í tölvugeiranum. Þessi 10 ára áætlun Japana byggðist á því að hanna skynsaman velbúnað byggðan á Prolog á svipanan hátt og venjulegar tölvur byggðu á vélamáli. Ég hreyfst með í þeirri bylgju sem þessar hugmyndir ollur og ekki minkaði áhuginn eftir Prolog námskeið sem ég sat á hjá Oddi Benediktsyni upp í háskóla 1984. En um það leiti sá ég um tölvunet Skýrr. Tölvunet voru þá í mjög hraðri þróun og þó gervigreindin vakti áhuga minn var þróunin það ör í tölvunetum að lítið annað komst að. Tenging hudruð ríkisstofnana og samtenging megintölva og sívinnsla Skýrr voru mínar ær og kýr. Internetvæðingin á Íslandi hófst á þessum árum, frukvöðull hennar er án efa Jóhann Gunnarsson, en ég stat stofnfund Surís fyrir hönd Skýrr þar sem lögð voru drög að fyrsta internetsambandinu. Það voru ófá skiptin sem við Einar Reynis, glímdum við vandamál og tilraunir, þó margar tenginganna voru fyrstar sinnar tegundar, situr þó fyrsta háhraðatengingin ofarlega í minni. En flóra protokolla og tenginga var ævintýraleg enda var hugsjón Jóns Þ. Þórhallssonar forstjóra Skýrr að leyfa allar tegundir tenginga við hvaða tölvukerfi sem var.  Þessi starfsemi var og er enn að einhverju leiti það sem kalla má “core business” hjá Skýrr, engu að síður er  þessu gerð lítil skil í bókinni “Upplýsingaiðnaður í hálfa öld.”, líklega má þar um kenna þekkingaleysi höfunar.

Um 10 árum seinna eða um 1994 er tölvunetsbyltingin afstaðin. Sú ánægjulega þróun hafði orðið á markaðinum að hann  hafði dottið niður á IP, tölvunet voru orðin rútína og mun einfaldari og engra byltinga að vænta IP, X.25, ISDN var komið og ATM var fyrirsjáanleg framtíð. Þá ákvað ég að snúa mér að gervigreindinni þó þannig að ég fylgdist með þróun mála í tölvusamskiptum. 

Á áttunda áratug síðustu aldar má segja að gervigreind sé orðin að iðnaði, fyrirtæki sem sérhæfa sig í gervigreind skjóta upp kollinum og í flestum stærri fyrirtækja eru reknar deildir eða hópar sem nota eða vinna að gerð sérfræðingakerfa. Rannsóknir á gervitauganetum sem höfðu að verulegu leiti verið grundaðar á einnar lags perceptron netum fyrir 1970 höfðu lagst af eftir skrif Minsky og Papert 1969, hófust nú aftur og má rekja upphaf endurlífgunarinnar til skrifa Rumelhart upp úr 1986. Fjöllaga gervitauganet höfðu sannað gildi sitt og nú hófst þróun sem enn sér ekki fyrir endan á. Hopfield net, Boltzmann machine og fleiri sáu dagsins ljós, en það var Cybenko sem setti fram sönnun um að tveggja-laga gerivitauganet gætu túlkað (eða áætlað) hvaða  sem er en eins-lags gerivitauganet getur túlkað hvaða samfelda fúnksíon sem er (Cybenko theorem). Grannfræði fjöllaga gervitauganeta má að hluta rekja til rannsókna í GA (genetic algorithms) sem er þáttur undir gervigreind sem byggir á því að vélar læri í gegnum þróun. Grannfræði gervitauganeta er þó ekki komið lengra á veg en svo að í flestum tilfellum er byggt á reynslu og innsæji við hönnun gervitauganeta þó aðferðafræði LeCun um “optimal brain damage” sé oft notuð við við lágmörkun á einingum og aðferðafræði Marchand og Frean um viðbætur á einingum er það enn svo að grannfræði upphafsneta eru byggð á reynslu og innsæji.

Flækja lærdómsferla gervitauganeta hefur verið rannsökuð ítarlega. Niðurstöður  Avrim Blum og Ron Rivest 1992 um leysanleika lærdómsferla gervitauganeta eru sannfærandi og sýna að þau eru “NP-complete” þ.e. þó fjöldi lægða vægisrýmisins sé veldisfall er víðvær kjörstaða vægja finnanleg.

En hvað eru gervitauganet ?
Engin samhljóða skilgreining hefur verið samþykkt meðal vísindamanna, en algengast er að skilgreina gervitauganet sem mengi einfaldra vinnslueininga þar sem heildar hegðun stjórnast af tengingum á milli vinnslueininganna og stuðlum vinnslueininganna. Hugmyndin kemur af þekkingu okkar á starfsemi heilans, lífræðilegum tauganetum gerðum úr taugafrumum og taugaendum.
Einingarnar í gervitauganeti byggjast á einfaldri stærðfræði formúlu:
Lát gefna sellu k hafa m fjölda inntaka og vikt úttak sellu k er
og vikt úttak sellu k er

  

Skipta má gervitauganetum niður með ýmsum hætti:

Eftir notkun: Flokkun (Classification), Klössun (Clustering), Nálgun falls (Function approximation), Spá eða áætlun (Prediction)
Eftir tegundum innri tenginga: Statísk (Feedforward), Dýnamísk(Feedback)
Eftir grannfræði: Einnar lags, Fjöllaga, Hálf/full Endurlaga (Limited/fully recurrent), Sjálf-skipulögð
Þjálfunaraðferð: Leiðbeinandi (Supervised), Sjálfstæð (Unsupervised)
Algengast er að einingar tauganeta sé raðað upp þannig að upplýsingarnar fari í eina átt, svonefnd feed-forward net, sem líta þá út eitthvað í þessa veru:

Hér er FF net með 4 inntakssellum 2 úttakssellum og 3 sellum í falda laginu. Allar sellur senda til allra sella í næsta lagi fyrir ofan.

Eins og glökkt má sjá, lítur þetta mjög einfaldlega út, vandamálið er hins vegar flækjustuðull netanna sem er veldisfall af fjölda inntaka en hvert inntak er vidd í matrix. Það reynir því mjög á hönnuð netsins að beyta rakhnífi Occams því þjálfun nets með tugi eða hundruð inntaka getur verið gríðarlega tímafrek aðgerð.
Tauganet af þessu tagi eru statisk líkt og sérhæfð tauganeti í auga, eftir að þau hafa lært verður þeim ekki auðveldlega breytt. Þau hafa það sem líkja má við langtíma minni en ekkert skammtímaminni. Þau hafa hins vegar mjög mikla aðlögunarhæfni og geta túlkað gögn sem þau hafa aldrei séð áður. Ef reynt er að bæta við "þekkingu" netanna eftir þjálfun, kemur upp staða sem nefnd er “catastrophic forgetting”. Eina leiðin til þess að þjálfa þau aftur t.d. þegar ný mynstur koma upp sem það getur ekki túlkað, er að bæta þeim við fyrri upplýsingar og þjálfa netið frá grunni.ISE kerfi IT Ráðgjafar á að geta rað-lært og gleymt skipulega.
En hvernig læra netin ?
Þjálfun tauganeta byggist á því að breyta vigtum tenginganna þar til netið hefur lært að þekkja viðfangsefnið, þetta er ekki ólíkt því hvernig við lærum sjálf. Perceptron þálfunarregla niðurstöður úr netinu eru bornar saman við réttar niðurstöður og vikt breytt eftir því:

Til eru fleiri aðferðir við þjálfun neta en ég kann að nefna, en sú algengasta er er backpropagation sem Bryson og Ho uppgötvuðu um 1970 en hún er til í ótal útgáfum. Megin inntak hennar er að byrjað er á að setja litla slembitölu fyrir hverja vikt, þjálfunargögnin eru svo keyrð í gegnum netið og úttakið reiknað út. Úttakið er borið saman við rétta lausn og villan send í hina áttina í gegnum netið. Viktin er leiðrétt með delta reglunni:(Widrow og Hoff, einnig kallað LMS Least Mean Square) þar sem villan er litla delta, alfa er þjálfunar hraðall (learning rate). Þjálfunar hraðallinn segir til um hve stór stökk á að taka í hvert skipti. þetta er endurtekið þar til villan er ásættanleg (ef hún verður það).Fjöldi skipta sem netið fer í gegnum gögnin er nefnd Epochs

Gervi-greind á ótvírætt heima innan tölvunarfræðinnar, en hún á skurðpunkta við  ótal greinar vísinda. Í dag er algengt að skilgreina gervi-greind á fjóra mismunandi vegu með mismunandi áherslum:

            Kerfi sem hugsa eins og fólk

            Kerfi sem hugsa rökvíst

            Kerfi sem hegða sér eins og fólk

            Kerfi sem hegða sér skynsamlega

Gerður er greinarmunur á mannlegri hugsun og hegðun annarsvegar og rökrænni eða skynsamri hugsun eða hegðun hins vegar. Sá sem tapar í skák hefur gert sig sekann um að beyta ekki rökrænni hugsun og því tapað, hann hefur engu að síður beitt mannlegri hugsun, mannleg hugsun og hegðun er ekki alltaf skynsamleg. Það er rétt að leiða aðeins hugan að hugtakinu “hugsun” og þó væntanlega fyrir þá sem telja hugsun aðeins framkvæmanlega af lífræðilegum heilum. Hugsun er að sjálfsögðu efnaflutningur á milli eininga þar sem hver eining er sjálfstæð en án heildarinnar væri einingin gagnslaus líkt og maur án bús, það eru tækin sem hugsun notar. Hugsun samanstendur af skilningi, þýðingu, sköpun, tungumáli, rökleiðslu, námi og meðvitund. Við þurfum að líta á hugsun með opnum huga, meðvitund í microheimi er öðruvísi en meðvitund okkar. Ef við teljum að það þurfi hugsun til þess að tefla, aka bíl, þekkja andlit, semja ljóð, spá fyrir um veður, spá fyrir um hlutabréfamarkaðinn, sjúkdómsgreina, spila á hljóðfæri, semja tónlist, mála listaverk o.s.frv. þá hljótum að samþykkja að tölvur hugsi því allt þetta hafa tölvur gert. Tölvur geta að sjálfsögðu ekki framkvæmt þá hugsun sem þarf til þess að elska, reiðast eða hata, einfaldlega vegna þess að við skiljum ekki nákvæmlega þessar tilfinningar og hver og einn upplifir þær með mismunandi hætti. Tengingimöguleikar lífræðilegs taugakerfis er eins og gefur að skilja mjög stór tala og því má leiða líkur að því að ekkert okkar hafi nákvæmlega sömu forsendur þó niðurstöður séu líkar. Tölvur geta enn sem komið er ekki framkvæmt hugsanir sem innifela sjálfstæðar tilfinningar.

Kerfi sem hugsa eins og fólk:

Hugfræði (cognitive science), sem er fremur grein innan sálfræðinnar en tölvunarfræðinnar fjallar um þessa hlið gervigreindar þar sem skoðun á mönnum og dýrum í gegnum sálfræðilegar tilraunir og sjálfskoðun eru grundvöllur kenninga um hugsun og samskipti véla og manna.

Kerfi sem hugsa rökvíst:

Aristoteles var fyrstur til þess að skilgreina “rétta hugsun” þ.e. hugsun sem er rökfræðilega rétt og er því upphafsmaður rökfræðinnar. Rögfræðin var þróðuð áfram innan stærðfræðinnar og um miðbik 20. aldar voru komin fram forrit sem gátu leyst vandamál sem sett voru fram með rökfræðilegum hætti. Megin vandamálið hér er að það er ekki auðvelt að breyta óformlegum upplýsingum í rökfræðilegt form, sér í lagi ef upplýsingarnar eru minna en 100% öruggar. Annað vandamál er að það er mikill munur á því að geta leyst vandamál í raunveruleikanum og að setja upp formlegar aðferðir sem útskýra hvernig þau má leysa.

Kerfi sem hegða sér eins og fólk:

Alan Turing skilgreindi vitræna hegðun sem því að líkja eftir fólki þannig að ekki yrði greint á milli vélar og manns, þessi skilgreining er lögð hér til grundvallar. Svokallað Turing test skilgreinir hvað tölvan eða vélin þarf að geta gert til þess að standast þessa skilgreiningu:

            Tungumálakunnátta, til þess að geta haft tjáskipti við fólk.

            Þekking, geymd og numin.

            Rökfræði til þess að nota og setja fram þekkinguna

            Þarf að geta lært, notað þekkinguna til þess að draga nýjar ályktanir.

Áherslan á að standast Turing test innan gervigreindar hefur ekki verið mikil, einfaldlega vegna þess að krafan um að hegða sér eins og fólk hefur aðeins þýðingu þegar gervigreindarforrit hafa samskipti við fólk og er sá þáttur jafnan aðeins hýðið utanum kerfið sem þá sjalnast er hannað með manninn sem fyrirmynd.

Kerfi sem hegða sér skynsamlega:

Að hegða sér skynsamlega þýðir að að hegða sér með þeim hætti að það leiði til þess að settum markmiðum sé náð að gefnum forsendum. Þessi skilgreining gervigreindar hefur með það að gera að hanna skynsama gjörendur (rational agents). Að hugsa rökrænt getur verið þáttur í því er að hegða sér skynsamlega,  skynsamir gjörendur þurfa hins vegar líka að geta brugðist við umhverfinu af skynsemi í tilfellum þar sem aðferðir rökrænnar hugsunar koma ekki að notum.  Sem dæmi um slíkt má nefna tilfelli þar sem rökræn hugsun gefur enga niðurstöðu eða gefur ekki niðurstöðu innan tímamarka.

Gervitauganet eru vissulega byggð á þekkingu okkar um starfsemi heilans, hvernig við lærum og hvernig við notfærum okkur það sem við lærum. Í mörgum tilfellum eru þau notuð í dag við lausn vandamála sem vélar geta leyst en maðurinn ekki. Við beytum gervitauganetum á þröng svið og nýtum okkur þá kosti sem tölva hefur umfram manninn, sem er að sjálfsögðu hraði í meðhöndlun gagna. Mynsturgreining er slíkt svið. Undanfarin sjö ár hef ég unnið við gerð tauganeta sem finna falsanir og misferli í kortaviðskiptum fyrir fjölþjóðleg fyrirtæki, tauganet mín eru notuð til þess að finna misferli í hundruð miljóna færslna á degi hverjum á rauntíma. Að jafnaði hefur tekið um 9 mánuði fyrir mig að koma slíku neti í gang, skipulag og uppbygging verkefnisins er að verulegu leiti byggt á Christopher M. Bishop "Neural Networks for Pattern Recognition", en einnig á "Statistical Pattern Recognition" eftir Keinosuke Fukunaga, "Neural Smithing" eftir Reed og Marks, "Neural Networks" eftir Haykin og auðvitað "Artificial Intelligence, a modern appproach" eftir Russel og Norvig. Með þeim hundruð greina um þetta efni sem birtast nær mánaðarlega m.a. í "Neural Networks" fagritinu.:

Gerð tauganeta skiptst í eftirfarandi verkþætti.

  1. Vandamálagreining
  2. Söfnun gagna
  3. Undirbúningur gagna, tölfræðiúrvinnsla
  4. Hönnun og þjálfun tauganetsins
  5. tölfræðiúrvinnala niðurstaðna
  6. Tauganetið sett í vinnslu raungagna
  7. Reglulegt tölfræðieftirlit og umsjón.

Við vandamálagreiningu byrja ég á að kanna hvaða væntingar viðskiptavinurinn hefur gagnvart nýju tauganeti. Með tilkomu hermis sem ég hannaði má setja fram mælanleg markmið, hermirinn mælir hluti eins og hlutfall rangra túlkanna (false/positive), hlutfall greindra misferla af heildarmisferlum í kortum, færslum og upphæðum (Card detection rate, transaction detection rate, volume detection rate) hlutfall misferla sem greindar eru í fyrstu færslu (first found detection rate) og hve margar færslur hafi átt sér stað fyrir greiningu (detection delay). Eftir því sem ég best veit, hefur ekkert annað fyrirtæki hermi af þessu tagi þar sem útreikningur á þessum þáttum í gæði kerfa er staðlaður yfir línuna. Hermirinn brýtur auk þess niðurstöðurnar niður í smærri einingar sem flokka má úr gögnunum en hann má nota til þess að mæla gæði hvaða kerfis sem er sem notað er til þess að áætla eða spá fyrir um niðurstöður.  Á þessu stigi skoða ég einnig hvað gögn eru fyrir hendi og hvort einhverjar breytingar hafa orðið eða eru væntanlegar í gögnunum. Það er ákaflega mikilvægt þegar tauganet eru hönnuð að gögnin sem notuð eru við þjálfun netsins séu á sama formati og gögnin sem notuð verða þegar netið er sett í vinnslu. Reiknigeta sem ég hef aðgang að er einnig skoðuð, en oft hefur þar skort mikið á að það hafi nægt og hef ég þá þurft að finna óhefðbundnar lausnir. Til að mynda þurfti ég í einu tilfelli að samnýta allar lausar PC vélar um kvöld og helgar til þjálfunar neta til viðbótar við reiknigetu 3ja misöflugra móðurtölva. Þekking fólks á gögnunum og vandamálinu sem ég þarf að leysa er einnig skoðað á þessu stigi. Vandamálagreiningunni er lokið með skýrslu með tölfræðiupplýsingum sem lýsa vandamálinu eins vel og unnt er, þær kröfur sem gerðar eru til tauganetsins og áæltuðum tíma sem verkið mun taka ef ég tel vandamálið leysanlegt.

Söfnun gagna hefur verið nokkuð tímafrek aðgerð, en með tilkomu gagnavöruhúsa sem eru mjög að ryðja sér til rúms, hefur tekist að minka tímann verulega. Gögnin sem ég safna geta fyllt mörg terabite og flutningur á slíku magni er tímafrekur(allt upp í marga daga). Í þessu stigi skoða ég ábyggileika gagnanna, en þættinum er lokið með tölfræðiskýrslu.

Undirbúningur gagna, tölfræðiúrvinnsla er næsti þáttur. Þar merki ég misferli í þeim tilgangi að tauganetið geti lært að þekkja þau. Það er að sjálfsögðu ekki hægt að nota öll gögnin, það yrði of tímafrekt því ég þjálfa hundruð og jafnvel þúsund net áður en ég vel það besta. Því er nauðsynlegt að notast við úrtak, mín reynsla hefur sýnt að hlutföllin á milli misferla og annarra færslna sé í lagi við 2:10, skiptingin er mjög mikilvægur þáttur því verið er að ýkja hlutfall misferla margfallt. Ég minnist þess að hafa lesið grein eftir 2 professora við þekkta háskóla í Bandaríkjunum í einni af útgáfum IEEE. Umræddir menn höfðu fengið styrk frá bandaríkjastjórn til  þess að kanna notagildi gagnavöruhúsa við misferlisleit. Greinin var að öllu leiti furðuleg og enn furðulegra að IEEE skuli hafa birt þetta, en líklega hafa þeir gert það vegna stöðu þessara manna. Þeir staðhæfðu að skiptingin 1:1 væri í lagi án nokkurra sannanna, en mér þótti það nokkuð óáreiðanlegt. Ég get ekki sannað að þessi skipting sé betri en einhver önnur og gat ekki látið viðskiptavinin borgar fyrir tilraunastarfsemi í þessa áttina, sem strýðir gegn heilbrigrði skynsemi. Ég átti þess kost að ræða í nokkur skipti við starfsbróður minn sem sér um þróun tauganeta hjá HNC í bandaríkjunum (nú Fair Isaac) um þessa skiptingu, hann er að vísu kjarneðlisfræðingur en ekki sérfræðingur í gervigreind, en hafði sömu skoðun á þessu tölfræðivandamáli og ég, því hef ég haldið mig við þessa skiptingu án tímafrekra sannanna. Úrtakið er kanski 1-2% af heildar gögnum og því mun meðfærilegra magn. Með aðstoð  sérhæfðra forrita sem ég hef skrifað, finn ég út úr þessum gögnum hvaða hráu þættir gagnanna gefa útreiknanlega áhættu (risk factors), en þeir þættir eru notaðir síðar.

...meira síðar....

Hafðu samband jonb@it-cons.com

 

Ég get með góðri samvisku sagt, að þessi hugbúnaður er einn sá besti sem ég hef séð fyrir Windows. Þú getur pantað hann hér.

Með þessum hugbúnaði getur þú haft stjórn á "dýrinu" Windows án þess að vera sérfræðingur, og jafnvel þó þú sért sérfræðingur.

Þessi hugbúnaður er frá sama framleiðanda, þú getur pantað hann hér, þetta vantar alveg í Windows.
© IT Consultancy and Software Design LTD