|
Um gervigreind
og reynslu IT ráðgjafar á því sviði
Vinnslugeta
og minni hafa verið og eru enn þröskuldar í þróun gervigreindar,
þó hefur tæknin leyft okkur að þróa takmörkuð kerfi
sem hafa þegar haft gríðarleg áhrif, kerfi sem læra,
hugsa og hegða sér skynsamlega í takmörkuðu umhverfi.
Fyrir um 5 árum gaf Ray
Kurzweil bókina “The
age of spiritual machines” í henni áætlar hann að
venjuleg einkatölva muni ná vinnslugetu mannsheila eða
um reikniaðgerðum
á sekúndu fyrir árið 2019. Einkatölvur í dag ná u.þ.b.
reiknigetu. Öflugasta tölva veraldar er IBM
BlueGene/L, hún hefur 32.768 örgjöfra og skilar
u.þ.b. .
Öflugasta PC vél veraldar er Orion
DC-96, hún framkvæmir rúmlega
reikniaðgerðir
á sekundu.
Kurzweil byggir á kenningu sinni um að þróunin
verði hraðari en hið þekkta lögmál
Moore og færir sterk rök fyrir því. Þessi öra þróun
og aðgengi upplýsinga gefur þeim sem vinna við gervigreind
tækifæri til þess að glíma við flóknara umhverfi og
loks yfirstíga greind manna. Við gætum fengið að upplifa
það sem frumkvöðlar gervigreindar dreymdu um. Ég
ræddi við Kurzeeil um daginn og spurði
hann um stöðu mála, hvort hann telur
enn að áætlanir hans muni standast.
Við fórum lítillegar í gegnum
áætlanir hans fyrir 2009 og vorum sammála
um að þróunin væri enn eins og
hann hafi séð fyrir. Kurzweil gaf út
nýja athygliverða bók fyrir skömmu
sem ber sama titil og gömul vísindaskáldsaga
efir Richard O. Fleischer frá 1966 eða "Fantastic
Voyage", þar lýsir hann ásamt
Terry Grossman hvernig þeir sem verða á
lífi eftir um 50 ár, geta lifað nær
endalaust. Þetta er ekki vísindaskáldsaga.
Minn
þáttur í gervigreind undanfarin ár hefur snúist um notkun
gervitauganeta
við mynsturleit.
Slík kerfi læra af reynslunni og nota þann lærdóm til
þess að áætla niðurstöður nýrra gagna þó þau séu töluvert
frábrugðin þeim gögnum sem notuð voru til þess að kenna
kerfinu, þ.e. þau hafa öðlast skynsemi í gegnum þekkingu
á fortíðinni til þess að taka ákvörðun út frá breyttum
forsendum. Í því fellst styrkur slíkra kerfa. Tauganet
af þessu tagi hafa reynst vel við leit að kortamisferlum,
peningaþvætti, bókhaldssvikum, tryggingasvikum, verðbréfaviðskiptum,
myndgreiningum, hljóðgreiningu, umhverfisrannsóknir,
anditsgreiningu, rithandargreiningu og ekki síst við
rannsóknir þar sem mynsturleit er snar þáttur.
En
lítum aðeins á sögu gervigreindar og tauganeta.
Sumarið
1956 komu saman til tveggja mánaða vinnufundar í Dartmounth
í Bandaríkjunum tíu manns. Tilgangur vinnufundarins
var að koma saman þeim vísindamönnum sem sem höfðu áhuga
á tauganetum og rannsóknum á greind. Fundurinn var að
frumkvæði John McCarthy sem þá hafði nýlokið meistaranámi
frá Princeton og vann nú við Dartmouth College.
Þátttakendur
voru:
John McCarthy frá Princeton, Marvin
Minsky frá Princeton,Claude
Shannon, Bell labaratories, Nathaniel
Rochester frá Princeton, Trenchard More frá Princeton,
Arthur
Samuel frá IBM, Ray
Solomonoff frá MIT, Oliver
Selfridge frá MIT,
Allen
Newell frá CMU, Herbert
Simon frá CMU.
Þessi
fundur markar faglegt upphaf gervigreindar og kynnir
til sögunar þá menn sem standa í fylkingarbrjósti gervigreindar
næstu 20 árin á eftir. þar kemur McCarthy fyrst fram
með fagheitið “Artificial Intelligence” eða gervigreind
eins og það er nefnd á Íslensku. Á fundinum kynntu Newell
og Simon LT (the Logic Theorist)
og sögðu um það að þeir hefðu fundið með því
forrit sem væri þess megnugt að hugsa ónúmerískt og
þar með aðskilið huga frá líkama. Stór orð en sönn ef
við reynum að aðskilja tilfinningalegri hugsun frá hugsun
sem snýr að vinnslu upplýsinga.
Þó
faglegur grunnur hafi
verið lagður að gervigreind á þessum fundi, á gervigreind
sér lengri sögu. Fyrsta vísindagreindin sem eignuð er
gervigreind var skrifuð 1943 af Warren
McCulloch og Walter
Pitts. Þeir settu saman kenningar um virkni og uppbyggingu
taugafruma í heilanum, kenningar Russell
og Whitehead
um yrðingarökfræði
og tölvunarkenningar
Alan Turing.
Niðurstaða þeirra var model af gervi-taugafrumum sem
hver um sig gátu verið í “kveikt” ham eða “slökkt” ham
þar sem hami var náð með áreiti tengdra gervi-taugafruma.
Þeir sýndu fram á að
niðurstöðu hvaða reiknanlegs falls sem er, mátti ná með neti slíkra gervi-taugafruma.
Þeir lögðu einnig til í greininni að slík gervi-tauganet
gætu lært, sem Danold
Hebb sannaði að var rétt sex árum síðar með einfaldri
uppfærslu aðferð á vigt tenginanna á milli eininganna.
Marvin Minsky og Dean Edmonds byggðu fyrstu gervi-tauganets
tölvuna (SNARC) árið 1951 úr 3000 lömpum og afgangs
sjálfstýringu úr B-24 sprengjuflugvélar. Tölvan hafði
40 gervi-tauganetsfrumur (sellur).
Rekja má aðferðafræði bæði samtengingasinna (connectionism)
og rökfræðisinna (logicism) innan gervigreindar til
skrifa McCulloch og Pitts.
Samtengingasinnar
vinna með gervitauganet með það að markmiði að útskýra
og hanna greind.
Rökfræðisinnar
leitast við að útskýra og hanna greind út frá rökfræðilegum
forsendum.
Framanaf
ríkti mikil bjartsýni í notkun gervigreindar. Newell
og Simon þróuðu LT áfram í GPS(General Problem Solver) en það kerfi var
hannað til þess að líkja eftir atferli manna við lausn
vandamála. Herbert Gelenter hannaði GTP (Geometry Theorem
Prover) sem sannaði kenningar á grundvelli frumreglna
líkt og LT. Gelenter sá fljótlega að rökfræðin bíður
upp á of marga mögulegar leiðir sem kanna þurfti í kerfinu
og flestar enduðu án niðurstöðu, hann hannaði því aðferðir
til þess að flýta leit að niðurstöðu.
Í
febrúar 1956 var sýnt í Bandarísku sjónvarpi, tölva
sem hafði lært dam. Þar hafði Arthur Samuel hjá IBM
afsannað þá kenningu að tölvur gætu aðeins gert það
sem þeim var sagt, því þetta forrit hans lærði dam fljótt
og lék betur en höfundurinn.
John
McCarthy, sem þá var kominn til MIT skrifaði forritunarmálið
LISP árið 1958 sem síðar varð vinsællt innan gervigreindar
sér í lagi í Bandaríkjunum. Sama ár skrifaði hann grein
sem bar yfirskriftina “Programs with Common Sense” og
má þar sjá fyrsta fullkomna gervigreindar kerfið á pappír,
sem hann nefndi “The Advice Taker”. Kerfið átti líkt
og LT og GTP að finna lausnir út frá þekkingu sinni
en ólíkt LT og GTP átti kerfið að geta aflað sér þekkingar
sjálft og gat jafnframt breytt grundvallarreglum (axioms)
ef þurfa þótti og í eðlilegi keyrslu kerfisins. Aðgangur að tölvum var mjög takmarkaður
á þessum tíma, McCarthy og félagar hans hjá MIT
fundu því upp “time sharing” sem gjörbylti aðgangsmálum
að tölvum, þetta gerist einnig 1958. Þessi hópur og
þessi nýja uppfinning varð síðan kveikjan að stofnun
“Digital Equipment Corporation”.
McCarthy for hins vegar til Stanford og setti
þar á stofn rannsóknarstofu í gervigreind, en sú rannsóknarstofa
lagði áherslu á gerð og notkun almennra aðferða við
rökfærslu.
Væntingarnar
voru miklar, líklega of miklar. Margt að því sem lagt
var upp með brást þegar sýna átti árangur. Gott dæmi
hvað þetta varðar voru forrit sem áttu að þýða milli
tungumála og voru byggð á gervigreind, frægastur er
líklega textinn úr ensk-rússnesku þýðingaforrit “the
vodka is good but the meat is rotten” sem átti að vera
þýðing á “the spirit is willing but the flesh is weak”. Vandamál af þessu tagi leiddu til þess að skipuð
var nefnd á vegum bandaríkjaþings til þess að gera úttekt
á árangri af vinnu með gervigreind á þýðingum, í kjölfarið
hætti Bandaríkjastjórn að fjármagna rannsólknir á því
sviði 1966.
Áður
en tíma-flækju kenningar (NP completeness theory) komu
fram, var almennt álitið að einungis þrufti að auka
afl örgjörfa og auka við innraminni til þess að kerfi
gengu í flóknara umhverfi. Í gervigreind vann fólk með
mjög takmarkað umhverfi svonefnd “microworld” en þegar
umhverfið varð flólknara var ekki nægjalegt að bæta
við minni og örgjörfaafli, það tókst ekki að sanna kenningar
sem gengu í einfaldara umhverfi, sem er vitaskuld afleitt.
Þetta var megin ástæða þess að Bresk stjórnvöld hættu
1973 að styrkja rannsóknir í gervigreind nema að litlu
leiti.
Minsky
og Papert sögðu
í bók sinni Perceptrons sem kom út 1969 að þó tauganet
gætu lært allt sem þau gátu lýst, þá gætu þau lýst afar
littlu. Þetta olli því að allar rannsóknir á tauganetum
lögðust af í áratug. Þeir félagar lýstu í bók sinni
afar einföldum netum og áttu niðurstöður þeirra einganvegin
við flóknari net, þær voru rangar að
því leiti. Það er kaldhæðnislegt að sama
ár og Perceptrons kom út, fundu Bryson og Ho upp lærdóms-algorithma
(back-propagation) fyrir fjöllaga tauganet sem átti
eftir að blása lífi í rannsóknir á tauganetum aftur
um 1980. Minsky heggur stundum í greinina,
hér
er nýlegt dæmi. Hann leyndi ekki skoðunum
sínum á Turing verðlaununum. En
hvað sem því líður er Minsky
tvímælalaust einn af frumkvöðlum
gervigreindar þó hann eigi vissulega einnig
sök á því að rannsóknir
á gervitauganetum lágu niðri í
tíu ár. Minsky gagnrýndi að
vísu "Lighthill" skýrsluna sem
lagði til að Breska ríkið stöðvaði
allar fjárveitingar til rannsókna á
gervigreind á áttunda áratug síðustu
aldar
Fyrstu
sérfræðingakerfi (expert systems) litu dagsins ljós
upp úr 1970. Það var sérfræðingakerfið Dendral frá þeim
félögum í Stanford Ed Feigenbaum, Bruce Buchanan og
Joshua Lederberg sem ruddi brautina. Tilgangur þess
var að finna mólikúl uppbyggingu út frá upplýsingum
um massa. Í kjölfarið fylgdi Mycin, sérfræðingakerfi
til þess að finna blóðsýkingar. Feigenbaum og Buchanan
nutu aðstoðar Edward Shortliffe við gerð kerfisins.
Mycin var frábrugðið Dendral að því leiti að Mycin notaði
tilbúnar reglur fengnar frá sérfræðingum í stað þess
að vera grundvallað á almennum fræðilegum rökfræðireglum.
Mycin var einnig með loðna rökfræði og gat því sagt
til um líkur. Líklega er Prospector sérfræðingakerfið
einna þekktast frá þessum tíma. Prospector var hannað
hjá MRI til þess að finna málmgrýti og reyndist mjög
gagnlegt.
Árangur
í tungumálaskilningi náðist ekki fyrr en vísindamenn
gerðu sér grein fyrir að þekking á viðfangsefninu skiptir
sköpum í gervigreind, þegar áherslan fór af verkfærunum
og aðferðafræðinni yfir á viðfangsefnið fóru hlutirnir
að gerast. Eitt fyrsta sérfræðingakerfið á þessu sviði
var SHRDLU en áherslan þar á málfræði reglur sem leiddi
til slæmrar þýðingar, það þurfti skilning á viðfangsefninu.
Málfræðingurinn Roger Schank hristi upp í vísindamönnum
með því að segja að það væri engin málfræði til og skrifaði
fjölmörg kerfi þar sem áherslan var á málskilning fyrst
og fremst. Með þetta að leiðarljósi skrifaði William
Woods Lunar kerfið sem notaði venjulega ensku og var
ætlað jarðfræðingum til rannsóknar á grjóti sem Appolo
geimflaugin kom með frá tunglinu.
Hugmyndir
Japana um “fimmtu kynslóðar tölvuna” 1981 varð að vítamínsprautu
fyrir fagið ekki sýst vegna hræðslu annarra um Japönsk
yfirráð í tölvugeiranum. Þessi 10 ára áætlun Japana
byggðist á því að hanna skynsaman velbúnað byggðan á
Prolog á svipanan hátt og venjulegar tölvur byggðu á
vélamáli. Ég hreyfst með í þeirri bylgju sem þessar
hugmyndir ollur og ekki minkaði áhuginn eftir Prolog
námskeið sem ég sat á hjá Oddi
Benediktsyni upp í háskóla 1984. En um það leiti
sá ég um tölvunet Skýrr. Tölvunet voru þá í mjög hraðri
þróun og þó gervigreindin vakti áhuga minn var þróunin
það ör í tölvunetum að lítið annað komst að. Tenging
hudruð ríkisstofnana og samtenging megintölva og sívinnsla
Skýrr voru mínar ær og kýr. Internetvæðingin á Íslandi
hófst á þessum árum, frukvöðull hennar er án efa Jóhann
Gunnarsson, en ég stat stofnfund Surís fyrir hönd Skýrr
þar sem lögð voru drög að fyrsta internetsambandinu.
Það voru ófá skiptin sem við Einar Reynis, glímdum við
vandamál og tilraunir, þó margar tenginganna voru fyrstar
sinnar tegundar, situr þó fyrsta háhraðatengingin ofarlega
í minni. En flóra protokolla og tenginga var ævintýraleg
enda var hugsjón Jóns Þ. Þórhallssonar forstjóra Skýrr
að leyfa allar tegundir tenginga við hvaða tölvukerfi
sem var. Þessi starfsemi var og er enn að einhverju leiti það sem kalla má
“core business” hjá Skýrr, engu að síður er
þessu gerð lítil skil í bókinni “Upplýsingaiðnaður
í hálfa öld.”, líklega má þar
um kenna þekkingaleysi höfunar.
Um
10 árum seinna eða um 1994 er tölvunetsbyltingin afstaðin.
Sú ánægjulega þróun hafði orðið á markaðinum að hann
hafði dottið niður á IP, tölvunet voru orðin
rútína og mun einfaldari og engra byltinga að vænta
IP, X.25, ISDN var komið og ATM var fyrirsjáanleg
framtíð. Þá ákvað ég að snúa mér að gervigreindinni
þó þannig að ég fylgdist með þróun mála í tölvusamskiptum.
Á
áttunda áratug síðustu aldar má segja að gervigreind
sé orðin að iðnaði, fyrirtæki sem sérhæfa sig í gervigreind
skjóta upp kollinum og í flestum stærri fyrirtækja eru
reknar deildir eða hópar sem nota eða vinna að gerð
sérfræðingakerfa. Rannsóknir á gervitauganetum sem höfðu
að verulegu leiti verið grundaðar á einnar lags perceptron
netum fyrir 1970 höfðu lagst af eftir skrif Minsky og
Papert 1969, hófust nú aftur og má rekja upphaf endurlífgunarinnar
til skrifa Rumelhart upp úr 1986. Fjöllaga gervitauganet
höfðu sannað gildi sitt og nú hófst þróun sem enn sér
ekki fyrir endan á. Hopfield net, Boltzmann machine
og fleiri sáu dagsins ljós, en það var Cybenko sem setti
fram sönnun um að tveggja-laga gerivitauganet gætu túlkað
(eða áætlað) hvaða
sem
er en eins-lags gerivitauganet getur túlkað hvaða samfelda
fúnksíon sem er (Cybenko theorem). Grannfræði fjöllaga
gervitauganeta má að hluta rekja til rannsókna í GA
(genetic algorithms) sem er þáttur undir gervigreind
sem byggir á því að vélar læri í gegnum þróun. Grannfræði
gervitauganeta er þó ekki komið lengra á veg en svo
að í flestum tilfellum er byggt á reynslu og innsæji
við hönnun gervitauganeta þó aðferðafræði LeCun um “optimal
brain damage” sé oft notuð við við lágmörkun á einingum
og aðferðafræði Marchand og Frean um viðbætur á einingum
er það enn svo að grannfræði upphafsneta eru byggð á
reynslu og innsæji.
Flækja
lærdómsferla gervitauganeta hefur verið rannsökuð ítarlega.
Niðurstöður Avrim Blum og Ron Rivest 1992 um leysanleika
lærdómsferla gervitauganeta eru sannfærandi og sýna
að þau eru “NP-complete” þ.e. þó fjöldi lægða vægisrýmisins
sé veldisfall er víðvær kjörstaða vægja finnanleg.
En
hvað eru gervitauganet ?
Engin samhljóða skilgreining hefur verið
samþykkt meðal vísindamanna, en algengast
er að skilgreina gervitauganet sem mengi einfaldra
vinnslueininga þar sem heildar hegðun stjórnast
af tengingum á milli vinnslueininganna og stuðlum
vinnslueininganna. Hugmyndin kemur af þekkingu
okkar á starfsemi heilans, lífræðilegum
tauganetum gerðum úr taugafrumum og taugaendum.
Einingarnar í gervitauganeti byggjast á
einfaldri stærðfræði formúlu:
Lát gefna sellu k hafa m fjölda inntaka
og vikt úttak sellu k er
og vikt
úttak sellu k er 


Skipta
má gervitauganetum niður með ýmsum
hætti:
Eftir
notkun: Flokkun (Classification), Klössun (Clustering),
Nálgun falls (Function approximation), Spá
eða áætlun (Prediction)
Eftir tegundum innri tenginga: Statísk (Feedforward),
Dýnamísk(Feedback)
Eftir grannfræði: Einnar lags, Fjöllaga,
Hálf/full Endurlaga (Limited/fully recurrent),
Sjálf-skipulögð
Þjálfunaraðferð: Leiðbeinandi
(Supervised), Sjálfstæð (Unsupervised)
Algengast er að einingar tauganeta sé raðað
upp þannig að upplýsingarnar fari í
eina átt, svonefnd feed-forward net, sem líta
þá út eitthvað í þessa
veru:

Hér
er FF net með 4 inntakssellum 2 úttakssellum
og 3 sellum í falda laginu. Allar sellur senda
til allra sella í næsta lagi fyrir ofan.
Eins
og glökkt má sjá, lítur þetta
mjög einfaldlega út, vandamálið
er hins vegar flækjustuðull netanna sem er
veldisfall af fjölda inntaka en hvert inntak er
vidd í matrix. Það reynir því
mjög á hönnuð netsins að beyta
rakhnífi Occams því þjálfun
nets með tugi eða hundruð inntaka getur
verið gríðarlega tímafrek aðgerð.
Tauganet af þessu tagi eru statisk líkt
og sérhæfð tauganeti í auga,
eftir að þau hafa lært verður þeim
ekki auðveldlega breytt. Þau hafa það
sem líkja má við langtíma minni
en ekkert skammtímaminni. Þau hafa hins
vegar mjög mikla aðlögunarhæfni
og geta túlkað gögn sem þau hafa
aldrei séð áður. Ef reynt er að
bæta við "þekkingu" netanna
eftir þjálfun, kemur upp staða sem
nefnd er “catastrophic forgetting”. Eina leiðin
til þess að þjálfa þau
aftur t.d. þegar ný mynstur koma upp sem
það getur ekki túlkað, er að
bæta þeim við fyrri upplýsingar
og þjálfa netið frá grunni.ISE
kerfi IT Ráðgjafar á að geta rað-lært
og gleymt skipulega.
En hvernig læra netin ?
Þjálfun tauganeta byggist á því
að breyta vigtum tenginganna þar til netið
hefur lært að þekkja viðfangsefnið,
þetta er ekki ólíkt því
hvernig við lærum sjálf. Perceptron
þálfunarregla niðurstöður
úr netinu eru bornar saman við réttar
niðurstöður og vikt breytt eftir því:

Til
eru fleiri aðferðir við þjálfun
neta en ég kann að nefna, en sú algengasta
er er backpropagation sem Bryson og Ho uppgötvuðu
um 1970 en hún er til í ótal útgáfum.
Megin inntak hennar er að byrjað er á
að setja litla slembitölu fyrir hverja vikt,
þjálfunargögnin eru svo keyrð
í gegnum netið og úttakið reiknað
út. Úttakið er borið saman við
rétta lausn og villan send í hina áttina
í gegnum netið. Viktin er leiðrétt
með delta reglunni:(Widrow og Hoff, einnig kallað
LMS Least Mean Square)
þar sem villan er litla delta, alfa er þjálfunar
hraðall (learning rate). Þjálfunar
hraðallinn segir til um hve stór stökk
á að taka í hvert skipti. þetta
er endurtekið þar til villan er ásættanleg
(ef hún verður það).Fjöldi skipta
sem netið fer í gegnum gögnin er nefnd Epochs

Gervi-greind
á ótvírætt heima innan tölvunarfræðinnar, en hún á skurðpunkta
við ótal greinar vísinda. Í dag er algengt að skilgreina
gervi-greind á fjóra mismunandi vegu með mismunandi
áherslum:
Kerfi sem
hugsa eins og fólk
Kerfi sem hugsa rökvíst
Kerfi sem hegða sér eins og fólk
Kerfi sem hegða sér skynsamlega
Gerður
er greinarmunur á mannlegri hugsun og hegðun annarsvegar
og rökrænni eða skynsamri hugsun eða hegðun hins vegar.
Sá sem tapar í skák hefur gert sig sekann um að beyta
ekki rökrænni hugsun og því tapað, hann hefur engu að
síður beitt mannlegri hugsun, mannleg hugsun og hegðun
er ekki alltaf skynsamleg. Það er rétt að leiða aðeins
hugan að hugtakinu “hugsun” og þó væntanlega fyrir þá
sem telja hugsun aðeins framkvæmanlega af lífræðilegum
heilum. Hugsun er að sjálfsögðu
efnaflutningur á milli eininga þar sem
hver eining er sjálfstæð en án
heildarinnar væri einingin gagnslaus líkt
og maur án bús, það eru tækin
sem hugsun notar. Hugsun samanstendur af skilningi,
þýðingu, sköpun, tungumáli,
rökleiðslu, námi og meðvitund. Við
þurfum að líta á hugsun með
opnum huga, meðvitund í microheimi er öðruvísi
en meðvitund okkar. Ef við teljum að það þurfi hugsun
til þess að tefla, aka bíl, þekkja andlit, semja ljóð,
spá fyrir um veður, spá fyrir um hlutabréfamarkaðinn,
sjúkdómsgreina, spila á hljóðfæri, semja tónlist, mála
listaverk o.s.frv. þá hljótum að samþykkja að tölvur
hugsi því allt þetta hafa tölvur gert. Tölvur geta að
sjálfsögðu ekki framkvæmt þá hugsun sem þarf til þess
að elska, reiðast eða hata, einfaldlega vegna þess að
við skiljum ekki nákvæmlega þessar tilfinningar
og hver og einn upplifir þær með mismunandi
hætti. Tengingimöguleikar lífræðilegs
taugakerfis er eins og gefur að skilja mjög
stór tala og því má leiða
líkur að því að ekkert okkar
hafi nákvæmlega sömu forsendur þó
niðurstöður séu líkar. Tölvur
geta enn sem komið er ekki framkvæmt hugsanir sem
innifela sjálfstæðar tilfinningar.
Kerfi
sem hugsa eins og fólk:
Hugfræði
(cognitive science), sem er fremur grein innan sálfræðinnar
en tölvunarfræðinnar fjallar um þessa hlið gervigreindar
þar sem skoðun á mönnum og dýrum í gegnum sálfræðilegar
tilraunir og sjálfskoðun eru grundvöllur kenninga um
hugsun og samskipti véla og manna.
Kerfi
sem hugsa rökvíst:
Aristoteles
var fyrstur til þess að skilgreina “rétta hugsun” þ.e.
hugsun sem er rökfræðilega rétt og er því upphafsmaður
rökfræðinnar. Rögfræðin var þróðuð áfram innan stærðfræðinnar
og um miðbik 20. aldar voru komin fram forrit sem gátu
leyst vandamál sem sett voru fram með rökfræðilegum
hætti. Megin vandamálið hér er að það er ekki auðvelt
að breyta óformlegum upplýsingum í rökfræðilegt form,
sér í lagi ef upplýsingarnar eru minna en 100% öruggar.
Annað vandamál er að það er mikill munur á því að geta
leyst vandamál í raunveruleikanum og að setja upp formlegar
aðferðir sem útskýra hvernig þau má leysa.
Kerfi
sem hegða sér eins og fólk:
Alan
Turing skilgreindi vitræna hegðun sem því að líkja eftir
fólki þannig að ekki yrði greint á milli vélar og manns,
þessi skilgreining er lögð hér til grundvallar. Svokallað
Turing test skilgreinir hvað tölvan eða vélin þarf að
geta gert til þess að standast þessa skilgreiningu:
Tungumálakunnátta, til þess að geta
haft tjáskipti við fólk.
Þekking, geymd og numin.
Rökfræði til þess að nota og setja
fram þekkinguna
Þarf að geta lært, notað þekkinguna
til þess að draga nýjar ályktanir.
Áherslan
á að standast Turing test innan gervigreindar hefur
ekki verið mikil, einfaldlega vegna þess að krafan um
að hegða sér eins og fólk hefur aðeins þýðingu þegar
gervigreindarforrit hafa samskipti við fólk og er sá
þáttur jafnan aðeins hýðið utanum kerfið sem þá sjalnast
er hannað með manninn sem fyrirmynd.
Kerfi
sem hegða sér skynsamlega:
Að
hegða sér skynsamlega þýðir að að hegða sér með þeim
hætti að það leiði til þess að settum markmiðum sé náð
að gefnum forsendum. Þessi skilgreining gervigreindar
hefur með það að gera að hanna skynsama gjörendur (rational
agents). Að hugsa rökrænt getur verið þáttur í því er
að hegða sér skynsamlega, skynsamir gjörendur þurfa hins vegar líka að
geta brugðist við umhverfinu af skynsemi í tilfellum
þar sem aðferðir rökrænnar hugsunar koma ekki að notum.
Sem dæmi um slíkt má nefna tilfelli þar sem rökræn
hugsun gefur enga niðurstöðu eða gefur ekki niðurstöðu
innan tímamarka.
Gervitauganet
eru vissulega byggð á þekkingu okkar um starfsemi heilans,
hvernig við lærum og hvernig við notfærum okkur það
sem við lærum. Í mörgum tilfellum eru þau notuð í dag
við lausn vandamála sem vélar geta leyst en maðurinn
ekki. Við beytum gervitauganetum á þröng svið og nýtum
okkur þá kosti sem tölva hefur umfram manninn, sem er
að sjálfsögðu hraði í meðhöndlun gagna. Mynsturgreining
er slíkt svið. Undanfarin sjö ár hef ég unnið við gerð
tauganeta sem finna falsanir og misferli í kortaviðskiptum
fyrir fjölþjóðleg fyrirtæki, tauganet mín eru notuð
til þess að finna misferli í hundruð miljóna færslna
á degi hverjum á rauntíma. Að jafnaði hefur tekið um
9 mánuði fyrir mig að koma slíku neti í gang, skipulag
og uppbygging verkefnisins er að verulegu leiti
byggt á Christopher M. Bishop "Neural Networks
for Pattern Recognition", en einnig á "Statistical
Pattern Recognition" eftir Keinosuke Fukunaga,
"Neural Smithing" eftir Reed og Marks, "Neural
Networks" eftir Haykin og auðvitað "Artificial
Intelligence, a modern appproach" eftir Russel
og Norvig. Með þeim hundruð greina um
þetta efni sem birtast nær mánaðarlega
m.a. í "Neural Networks" fagritinu.:
Gerð
tauganeta skiptst í eftirfarandi verkþætti.
- Vandamálagreining
- Söfnun gagna
- Undirbúningur gagna, tölfræðiúrvinnsla
- Hönnun og þjálfun tauganetsins
- tölfræðiúrvinnala niðurstaðna
- Tauganetið sett í vinnslu raungagna
- Reglulegt tölfræðieftirlit og umsjón.
Við
vandamálagreiningu byrja ég á að kanna hvaða
væntingar viðskiptavinurinn hefur gagnvart nýju tauganeti.
Með tilkomu hermis sem ég hannaði má setja fram mælanleg
markmið, hermirinn mælir hluti eins og hlutfall rangra
túlkanna (false/positive), hlutfall greindra misferla
af heildarmisferlum í kortum, færslum og upphæðum (Card
detection rate, transaction detection rate, volume detection
rate) hlutfall misferla sem greindar eru í fyrstu færslu
(first found detection rate) og hve margar færslur hafi
átt sér stað fyrir greiningu (detection delay). Eftir
því sem ég best veit, hefur ekkert annað fyrirtæki hermi
af þessu tagi þar sem útreikningur á þessum þáttum í
gæði kerfa er staðlaður yfir línuna. Hermirinn brýtur
auk þess niðurstöðurnar niður í smærri einingar sem
flokka má úr gögnunum en hann má nota til þess að mæla
gæði hvaða kerfis sem er sem notað er til þess að áætla
eða spá fyrir um niðurstöður. Á þessu stigi skoða ég einnig hvað gögn eru fyrir hendi og hvort
einhverjar breytingar hafa orðið eða eru væntanlegar
í gögnunum. Það er ákaflega mikilvægt þegar tauganet
eru hönnuð að gögnin sem notuð eru við þjálfun netsins
séu á sama formati og gögnin sem notuð verða þegar netið
er sett í vinnslu. Reiknigeta sem ég hef aðgang að er
einnig skoðuð, en oft hefur þar skort mikið á að það
hafi nægt og hef ég þá þurft að finna óhefðbundnar lausnir.
Til að mynda þurfti ég í einu tilfelli að samnýta allar
lausar PC vélar um kvöld og helgar til þjálfunar neta
til viðbótar við reiknigetu 3ja misöflugra móðurtölva.
Þekking fólks á gögnunum og vandamálinu sem ég þarf
að leysa er einnig skoðað á þessu stigi. Vandamálagreiningunni
er lokið með skýrslu með tölfræðiupplýsingum sem lýsa
vandamálinu eins vel og unnt er, þær kröfur sem gerðar
eru til tauganetsins og áæltuðum tíma sem verkið mun
taka ef ég tel vandamálið leysanlegt.
Söfnun
gagna hefur verið nokkuð tímafrek aðgerð, en með
tilkomu gagnavöruhúsa sem eru mjög að ryðja sér til
rúms, hefur tekist að minka tímann verulega. Gögnin
sem ég safna geta fyllt mörg terabite og flutningur
á slíku magni er tímafrekur(allt upp í marga
daga). Í þessu stigi skoða ég ábyggileika gagnanna,
en þættinum er lokið með tölfræðiskýrslu.
Undirbúningur
gagna, tölfræðiúrvinnsla er næsti þáttur. Þar merki ég misferli í þeim tilgangi að tauganetið geti
lært að þekkja þau. Það er að sjálfsögðu ekki hægt að
nota öll gögnin, það yrði of tímafrekt því ég þjálfa
hundruð og jafnvel þúsund net áður en ég vel það besta.
Því er nauðsynlegt að notast við úrtak, mín reynsla
hefur sýnt að hlutföllin á milli misferla og annarra
færslna sé í lagi við 2:10, skiptingin er mjög mikilvægur
þáttur því verið er að ýkja hlutfall misferla margfallt.
Ég minnist þess að hafa lesið grein eftir 2 professora
við þekkta háskóla í Bandaríkjunum í einni af útgáfum
IEEE. Umræddir menn höfðu fengið styrk frá bandaríkjastjórn
til þess að
kanna notagildi gagnavöruhúsa við misferlisleit. Greinin
var að öllu leiti furðuleg og enn furðulegra að IEEE
skuli hafa birt þetta, en líklega hafa þeir gert
það vegna stöðu þessara manna. Þeir staðhæfðu að skiptingin
1:1 væri í lagi án nokkurra sannanna, en mér þótti það
nokkuð óáreiðanlegt. Ég get ekki sannað að þessi
skipting sé betri en einhver önnur og gat ekki látið
viðskiptavinin borgar fyrir tilraunastarfsemi í þessa
áttina, sem strýðir gegn heilbrigrði
skynsemi. Ég átti þess kost að ræða í nokkur skipti
við starfsbróður minn sem sér um þróun tauganeta hjá
HNC í bandaríkjunum (nú Fair Isaac) um þessa skiptingu,
hann er að vísu kjarneðlisfræðingur en ekki sérfræðingur
í gervigreind, en hafði sömu skoðun á þessu tölfræðivandamáli
og ég, því hef ég haldið mig við þessa skiptingu án
tímafrekra sannanna. Úrtakið er kanski 1-2% af heildar
gögnum og því mun meðfærilegra magn. Með aðstoð sérhæfðra forrita sem ég hef skrifað, finn
ég út úr þessum gögnum hvaða hráu þættir gagnanna gefa
útreiknanlega áhættu (risk factors), en þeir þættir
eru notaðir síðar.
...meira síðar....
Hafðu samband
jonb@it-cons.com
|