III.Wczesne eksploracje: lata 50. i 60. XX wieku

Je�li maszyny maj� sta� si� inteligentne, musz� przynajmniej by� w stanie robi� rzeczy zwi�zane z my�leniem, kt�re mog� zrobi� ludzie. Pierwsze kroki w poszukiwaniu sztucznej inteligencji polega�y na zidentyfikowaniu niekt�rych konkretnych zada�, kt�re wed�ug nich wymagaj� inteligencji, i znalezieniu sposobu na pozyskanie maszyn do ich wykonania. Rozwi�zywanie zagadek, granie w szachy i warcaby, dowodzenie twierdze�, odpowiadanie na proste pytania i klasyfikowanie obraz�w wizualnych by�y jednymi z problem�w, z kt�rymi zmagali si� pierwsi pionierzy w latach 50. i 60. XX wieku. Chocia� wi�kszo�� z nich to problemy w stylu laboratoryjnym, czasami nazywane "zabawkami", niekt�re rzeczywiste problemy o znaczeniu komercyjnym, takie jak automatyczny odczyt wysoce stylizowanych znak�w magnetycznych na brzegu, atakowano r�wnie� kontrole i t�umaczenia j�zykowe. (O ile mi wiadomo, Seymour Papert by� pierwszym, kt�ry u�y� zdania "problem z zabawkami". "Podczas warsztat�w AI z 1967 r., w Atenach w stanie Georgia, wyr�nia� mi�dzy problemami tau lub "zabawkami ", problemami rho lub rzeczywistymi, oraz problemy theta lub "teorii" w sztucznej inteligencji. To rozr�nienie wci�� dobrze nam s�u�y. W tej cz�ci opisz� niekt�re z pierwszych rzeczywistych pr�b budowy inteligentnych maszyn. Niekt�re z nich zosta�y om�wione lub zg�oszone na konferencje i sympozja - czyni�c te spotkania wa�nymi kamieniami milowymi w narodzinach AI. Zrobi� r�wnie� wszystko, aby wyja�ni� podstawy dzia�ania niekt�rych z tych wczesnych program�w AI. Do�� dramatyczne sukcesy w tym okresie pomog�y stworzy� solidn� podstaw� dla kolejnych badania sztucznej inteligencji. Niekt�rzy badacze byli zaintrygowani (mo�na powiedzie�, �e zostali schwytani) metodami, kt�rych u�ywali, po�wi�caj�c si� bardziej na poprawie mocy i og�lno�ci wybranych technik ni� na zastosowaniu ich do zada�, kt�re wed�ug nich wymagaj� . Co wi�cej, poniewa� niekt�rzy badacze byli tak samo zainteresowani wyja�nieniem, w jaki spos�b m�zg rozwi�zuje problemy, jak przy pozyskiwaniu do tego maszyn, opracowywane metody by�y cz�sto proponowane jako wk�ad w teorie na temat ludzkich proces�w umys�owych. W ten spos�b badania w psychologii poznawczej i badania nad sztuczn� inteligencj� sta�y si� ze sob� �ci�le powi�zane.

Spotkania

We wrze�niu 1948 r. W California Institute of Technology (Caltech) w Pasadenie w Kalifornii odby�a si� interdyscyplinarna konferencja na temat tego, jak uk�ad nerwowy kontroluje zachowanie i jak m�zg mo�na por�wna� do komputera. Nazywa�o si� to Sympozjum Hixona na temat mechanizm�w m�zgowych w zachowaniu. Uczestniczy�o w nich kilku luminarzy i wyg�asza�o referaty, w tym Warren McCulloch, John von Neumann i Karl Lashley (1890 -1958), wybitny psycholog. Lashley wyg�osi� co�, co wed�ug niekt�rych by�o najwa�niejsz� przemow� na sympozjum. Zarzuci� behawioryzmowi jego statyczny obraz funkcji m�zgu i twierdzi�, �e aby wyja�ni� ludzkie mo�liwo�ci planowania i j�zyka, psychologowie musieliby zacz�� rozwa�a� dynamiczne, hierarchiczne struktury. Wyst�pienie Lashleya po�o�y�o podwaliny pod to, co sta�oby si� kognitywistyk�. Pojawienie si� sztucznej inteligencji jako pe�nego pola bada� zbieg�o si� (i zosta�o zapocz�tkowane) przez trzy wa�ne spotkania - jedno w 1955 r., jedno w 1956 r. I jedno w 1958 r. W 1955 r. Odby�a si� "Sesja na temat uczenia si� maszyn" zorganizowane w po��czeniu z Western Joint Computer Conference 1955 w Los Angeles. W 1956 r. W Dartmouth College zwo�ano "Summer Research Project on Artiial Intelligence". W 1958 r. Sympozjum na temat "Mechanizacji proces�w my�lowych" sponsorowa�o Narodowe Laboratorium Fizyczne w Wielkiej Brytanii.

Sesja na temat uczenia si� maszyn

Cztery wa�ne artyku�y zosta�y zaprezentowane w Los Angeles w 1955 roku. We wst�pie swojego przem�wienia do tej sesji Willis Ware napisa�:

"Dokumenty te nie sugeruj�, �e przysz�e maszyny ucz�ce si� powinny by� zbudowane zgodnie z og�lnym cyfrowym urz�dzeniem komputerowym; jest raczej tak, �e cyfrowy system komputerowy oferuje wygodne i wysoce elastyczne narz�dzie do badania zachowania modeli. Ta grupa dokument�w sugeruje kierunki ulepsze� dla przysz�ych konstruktor�w maszyn, kt�rych celem jest wykorzystanie cyfrowych maszyn obliczeniowych do tej konkretnej techniki modelowej. Szybko�� operacji musi by� wielokrotnie zwi�kszana; jednoczesne dzia�anie w wielu trybach r�wnoleg�ych jest silnie wskazane; wielko�� losowego dost�pu pami�� masowa musi przeskakiwa� o kilka rz�d�w wielko�ci; potrzebne s� nowe typy urz�dze� wej�ciowych. Dzi�ki takim post�pom i technikom om�wionym w tych dokumentach istnieje znaczna obietnica, �e systemy mog� zosta� zbudowane w stosunkowo bliskiej przysz�o�ci, co b�dzie imitowa� znaczn� cz�� aktywno�� m�zgu i uk�adu nerwowego "

Na szcz�cie poczynili�my znaczne post�py w zakresie produkt�w znajduj�cych si� na li�cie "wskaz�wek dotycz�cych ulepsze�" Ware'a. Szybko�� dzia�ania wzros�a wielokrotnie, w wielu systemach AI wykorzystywana jest praca r�wnoleg�a, pami�� o dost�pie swobodnym skoczy�a o kilka rz�d�w wielko�ci i dost�pnych jest wiele nowych typ�w urz�dze� wej�ciowych. By� mo�e konieczne b�d� dalsze usprawnienia. Pierwszy artyku� sesji, autorstwa Wesleya Clarka i Belmonta Farleya z Lincoln Laboratory MIT, opisa� niekt�re eksperymenty z rozpoznawaniem wzorc�w na sieciach element�w podobnych do neuron�w. Zmotywowani propozycj� Hebba, aby zespo�y neuron�w mog�y si� uczy� i dostosowywa� poprzez dostosowanie si�y ich wzajemnych po��cze�, eksperymentatorzy pr�bowali r�nych schemat�w dostosowywania si�y po��cze� w swoich sieciach, kt�re zwykle by�y symulowane na komputerach. Niekt�rzy chcieli tylko zobaczy�, co mog� zrobi� te sieci, podczas gdy inni, tacy jak Clark i Farley, byli zainteresowani konkretnymi aplikacjami, takimi jak rozpoznawanie wzorc�w. Ku przera�eniu neurofizjolog�w, kt�rzy skar�yli si� na nadmierne obci��enie, sieci te nazwano sieciami neuronowymi. Clark i Farley doszli do wniosku, �e "surowe, ale u�yteczne w�a�ciwo�ci uog�lniaj�ce posiadaj� nawet losowo po��czone sieci opisanego typu" .Kolejna para artyku��w, jedna autorstwa Geralda P. Dinneena (1924-), a druga Olivera Selfridge'a (1926-), obaj z Lincoln Laboratory firmy MIT przedstawi�y inne podej�cie do rozpoznawania wzor�w. W artykule Dinneen opisa; techniki obliczeniowe przetwarzania obraz�w. Obrazy zosta�y przedstawione komputerowi jako prostok�tny zestaw warto�ci intensywno�ci odpowiadaj�cych r�nym odcieniom szaro�ci na obrazie. Dinneen by� pionierem zastosowanie metod filtrowania w celu usuni�cia przypadkowych kawa�k�w ha�asu, pogrubienia linii i kraw�dzi. Rozpocz�� prac� od:

"W ci�gu ostatnich miesi�cy podczas serii spotka� po lunchu i lunchu grupa nas w laboratorium zastanawia�a si� nad problemami w tym obszarze. Nasze odczucie, niemal jednog�o�nie, by�o takie, �e istnieje potrzeba praktycznego dzia�ania, wybrania prawdziwego problemu na �ywo i zaj�cia si� nim ".

Tekst Selfridge'a by� kawa�kiem towarzysz�cym artyku�owi Dinneen. Operuj�c na "oczyszczonych" obrazach (jak na przyk�ad program Dinneen), Selfridge opisa� techniki pod�wietlania "cech" na tych obrazach, a nast�pnie klasyfikowania ich na podstawie cech. Na przyk�ad naro�niki obrazu, o kt�rych wiadomo, �e s� kwadratem lub tr�jk�tem, s� pod�wietlone, a nast�pnie zliczana jest liczba naro�nik�w w celu ustalenia, czy obraz jest kwadratem czy tr�jk�tem. Selfridge powiedzia�, �e "ostatecznie mamy nadziej� rozpozna� inne rodzaje cech, takie jak krzywizna, zestawienie pojedynczych punkt�w (tj. Ich wzgl�dne po�o�enie i odleg�o�ci) i tak dalej". Metody zapocz�tkowane przez Selfridge'a i Dinneena maj� fundamentalne znaczenie dla wi�kszo�ci p�niejszych prac nad umo�liwieniem maszynom "widzenia". Ich praca jest tym bardziej niezwyk�a, gdy we�mie si� pod uwag�, �e wykonano j� na komputerze, Lincoln Laboratory "Memory Test Computer", kt�ry dzi� mo�na by uzna� za niezwykle prymitywny. [Komputer testowy pami�ci (MTC) jako pierwszy u�y� modu��w pami�ci o swobodnym dost�pie z rdzeniem ferrytowym opracowanych przez Jaya Forrestera. Zosta� zaprojektowany i zbudowany przez Kena Olsena w 1953 roku w Digital Equipment Corporation (DEC). MTC by� pierwszym komputerem do symulacji dzia�ania sieci neuronowych (tych Clarka i Farleya). Kolejny artyku� dotyczy� programowania komputera do gry w szachy. Zosta� napisany przez Allena Newella, w�wczas badacza z Rand Corporation w Santa Monica. Dzi�ki biograficznemu szkicowi Newella napisanemu przez jego koleg�, Herb'a Simona z Carnegie Mellon University, wiemy co� o motywacji Newella i tym, jak zainteresowa� si� tym problemem:

"We wrze�niu 1954 roku Allen wzi�� udzia� w seminarium w RAND, w kt�rym Oliver Selfridge z Lincoln Laboratory opisa� dzia�aj�cy program komputerowy, kt�ry nauczy� si� rozpoznawa� litery i inne wzory. S�uchaj�c Selfridge'a charakteryzuj�cego jego raczej prymitywny, ale dzia�aj�cy system, Allen do�wiadczy� tego, o czym zawsze m�wi� jako jego "do�wiadczenie konwersji". "Od razu sta�o si� dla niego jasne", �e mo�na zbudowa� inteligentne systemy adaptacyjne, kt�re by�y znacznie bardziej z�o�one ni� cokolwiek jeszcze. o przetwarzaniu informacji w organizacjach, o cybernetyki i propozycjach program�w szachowych dodano teraz konkretn� demonstracj� wykonalno�ci komputerowej symulacji z�o�onych proces�w. W tym czasie zaanga�owa� si� w zrozumienie ludzkiej nauki i my�lenia poprzez symulacj� ".

Simon podsumowuje artyku� Newella na temat szach�w:

"[Przedstawi�] wymy�lny projekt programu komputerowego do gry w szachy w humanoidalny spos�b, obejmuj�cy poj�cia cel�w, poziomy aspiracji do zako�czenia poszukiwa�, satysfakcj� z" wystarczaj�co dobrych "ruch�w, wielowymiarowe funkcje oceny, generowanie subceli do realizacji cel�w, i co� w rodzaju najlepszego pierwszego wyszukiwania. Informacje o tablicy mia�y by� wyra�one symbolicznie w j�zyku przypominaj�cym rachunek predykat�w. Projekt nigdy nie zosta� wdro�ony, ale p�niej zapo�yczono z niego pomys�y do wykorzystania w NSS [Newell, Shaw i Simon] program szachowy w 1958 r. "

Newell zasugerowa�, �e jego cele wykraczaj� poza szachy. W swoim artykule napisa�: "Zatem celem tego wysi�ku jest zaprogramowanie obecnego komputera do nauki dobrej gry w szachy. Jest to spos�b na lepsze zrozumienie rodzaj�w komputer�w, mechanizm�w i program�w niezb�dnych do obs�ugi ultraskomplikowanych problem�w ". Proponowane techniki Newella mo�na uzna� za jego pierwsz� pr�b� uzyskania dowod�w na to, co on i Simon nazwali p�niej hipotez� fizycznego systemu symboli. Walter Pitts, komentator tej sesji, zako�czy� j� m�wi�c: "Jednak, podczas gdy panowie Farley, Clark, Selfridge i Dinneen na�laduj� uk�ad nerwowy, pan Newell woli na�ladowa� hierarchi� pierwotnych przyczyn, zwanych tradycyjnie umys�em. Ostatecznie dojdzie do tego samego, bez w�tpienia… " Aby doj�� do tego samego, "te dwa podej�cia, modelowanie neuronowe i przetwarzanie symboli, nale�y uzna� po prostu za r�ne poziomy opisu tego, co dzieje si� w m�zgu. R�ne poziomy s� odpowiednie do opisywania r�nych rodzaj�w zjawisk mentalnych

Letni projekt Dartmouth

W 1954 roku John McCarthy (1927-) do��czy� do Dartmouth College w Hanover, New Hampshire, jako adiunkt matematyki. McCarthy stale interesowa� si� czym�, co nazwano by sztuczn� inteligencj�. Zosta�o "uruchomione", m�wi, "bior�c udzia� w Sympozjum Hixon na temat mechanizm�w m�zgowych w zachowaniu we wrze�niu 1948 r., Kt�re odby�o si� w Caltech, gdzie zaczyna�em prac� magistersk� z matematyki". Podczas pobytu w Dartmouth zosta� zaproszony przez Nathaniela Rochestera (1919-2001) do sp�dzenia lata 1955 r. w dziale bada� informacyjnych Rochester w IBM w Poughkeepsie w Nowym Jorku. Rochester by� projektantem komputera IBM 701 i bra� r�wnie� udzia� w badaniach sieci neuronowych. W IBM tego lata McCarthy i Rochester przekonali Claude'a Shannona i Marvina Minsky'ego (1927-), w�wczas m�odszego adiunkta Harvarda z matematyki i neurologii, aby przy��czyli si� do nich, proponuj�c warsztaty, kt�re odb�d� si� w Dartmouth nast�pnego lata. Shannon, o kt�rym wcze�niej wspomnia�em, by� matematykiem w Bell Telephone Laboratories i ju� s�yn�� z pracy nad teori� prze��czania i teori� informacji statystycznych. McCarthy przej�� inicjatyw�, pisz�c propozycj� i organizuj�c co�, co nazwano "Letnim projektem badawczym na temat sztucznej inteligencji". Propozycja zosta�a przed�o�ona Fundacji Rockefellera w sierpniu 1955 r. Fragmenty wniosku brzmi� nast�puj�co:

"Proponujemy przeprowadzenie 2-miesi�cznego, 10-osobowego badania sztucznej inteligencji latem 1956 r. W Dartmouth College w Hanover, New Hampshire. Badanie ma by� przeprowadzone na podstawie przypuszczenia, �e ka�dy aspekt uczenia si� lub jakakolwiek inna cecha inteligencji mo�e by� w zasadzie tak precyzyjnie opisana, �e mo�na stworzy� maszyn� do jej symulacji. Zostanie podj�ta pr�ba znalezienia sposobu, w jaki maszyny b�d� u�ywa� j�zyka, tworzy� abstrakcje i koncepcje, rozwi�zywa� rodzaje problem�w zarezerwowanych obecnie dla ludzi i poprawia� si�. Uwa�amy, �e mo�na dokona� znacznego post�pu w zakresie jednego lub wi�cej z tych problem�w, je�li starannie wybrana grupa naukowc�w b�dzie pracowa� nad tym razem przez lato ". …
W obecnym celu przyjmuje si�, �e problemem sztucznej inteligencji jest sprawienie, aby maszyna zachowywa�a si� w spos�b, kt�ry nazwano by inteligentnym, gdyby tak zachowywa� si� cz�owiek ".

Fundacja Rockefellera zapewni�a fundusze na to wydarzenie, kt�re odby�o si� w ci�gu sze�ciu tygodni lata 1956 r. Okaza�o si� jednak, �e jest to bardziej ci�g�y sze�ciotygodniowy warsztat ni� letnie "studium". W�r�d os�b bior�cych udzia� w warsztatach tego lata, opr�cz McCarthy'ego, Minsky'ego, Rochestera i Shannona, byli Arthur Samuel (1901-1990), in�ynier w korporacji IBM, kt�ry napisa� ju� program gry w warcaby, Oliver Selfridge, Ray Solomonoff z MIT, kt�ry by� zainteresowany automatyzacj� indukcji, Allen Newell i Herbert Simon. Newell i Simon (wraz z innym naukowcem Rand, Cliffem Shawem) opracowali program do dowodzenia twierdze� w logice symbolicznej. Kolejnym naukowcem IBM by� Alex Bernstein, kt�ry pracowa� nad programem szachowym. McCarthy poda� kilka powod�w, dla kt�rych u�y� terminu "sztuczna inteligencja". Pierwszym by�o odr�nienie tematyki zaproponowanej na warsztaty w Dartmouth od wcze�niejszego tomu zam�wionych artyku��w, zatytu�owanych Automata Studies, wsp�redagowanych przez McCarthy'ego i Shannona, kt�re (ku rozczarowaniu McCarthy'ego) w du�ej mierze dotyczy�y ezoterycznego i raczej w�skiego przedmiotu matematycznego zwany teori� automat�w. Drugi, wed�ug McCarthy'ego, polega� na "unikni�ciu skojarzenia z" cybernetyk� ". Skoncentrowanie si� na sprz�eniu analogowym wydawa�o si� myl�ce i chcia�em unikn�� akceptacji Norberta Wienera jako guru lub k��tni z nim. "

Ta nazwa by�a (i nadal jest) kontrowersyjna. Wed�ug doskona�ej historii Pameli McCorduck o pocz�tkach sztucznej inteligencji, Art Samuel zauwa�y�: "S�owo" sztuczno�� "sprawia, �e my�lisz ,�e jest w tym co� fa�szywego, albo brzmi, jakby to wszystko by�o sztuczne i nie ma w tym nic prawdziwego. McCorduck m�wi dalej, �e " Newellowi lub Simonowi spodoba�o si� to zdanie i nazwali je w�asnym pracuj�c przez lata przy z�o�onym przetwarzaniu informacji. "Ale wi�kszo�� os�b, kt�re zapisa�y si� do pracy w tym nowym polu (w tym ja), u�ywa�a nazwy" sztuczna inteligencja "i tak nazywa si� to dzisiaj. (P�niej, Newell pogodzi� si� z t� nazw�. Komentuj�c tre�� pola, stwierdzi�: "Wi�c piel�gnuj nazw� sztuczna inteligencja. To dobra nazwa. Jak wszystkie nazwiska naukowc�w, b�dzie ros�o, aby sta� si� dok�adnie tym, czym jest pole jakie ma na my�li. ") Podej�cia i motywacje ludzi na warsztatach r�ni�y si�. Rochester przyby� na konferencj� z do�wiadczeniem w sieci element�w podobnych do neuron�w. Newell i Simon stosowali (a w�a�ciwie pomogli stworzy�) podej�cie do przetwarzania symboli. Jednym z temat�w, o kt�rych Shannon chcia� pomy�le� (zgodnie z propozycj�), by�o zastosowanie koncepcji teorii informacji w komputerach i modelach m�zgu. "(Po warsztatach Shannon odwr�ci� jednak uwag� od sztucznej inteligencji.) McCarthy napisa� �e chcia� zbudowa� "sztuczny j�zyk, kt�ry mo�na zaprogramowa� w komputerze do rozwi�zywania problem�w wymagaj�cych przypuszcze� i samodzielnego odniesienia. Powinien on odpowiada� j�zykowi angielskiemu w tym sensie, �e kr�tkie angielskie wypowiedzi na dany temat powinny mie� kr�tkich korespondent�w w j�zyku, podobnie jak kr�tkie argumenty lub przypuszczenia. Mam nadziej�, �e spr�buj� sformu�owa� j�zyk posiadaj�cy te w�a�ciwo�ci. . . " Chocia� McCarthy powiedzia� p�niej, �e jego pomys�y na ten temat s� nadal zbyt "�le sformu�owane" do prezentacji na konferencji, nie min�o wiele czasu, zanim przedstawi� konkretne propozycje u�ycia j�zyka logicznego i jego mechanizm�w wnioskowania do reprezentowania i rozumowania wiedzy. Chocia� rozprawa doktora Minsky'ego i niekt�re z jego p�niejszych prac koncentrowa�y si� na sieciach neuronowych, w czasie warsztat�w w Dartmouth zacz�� zmienia� kierunek. Teraz, jak napisa�, chcia� rozwa�y� maszyn�, kt�ra mia�aby tendencj� do tworzenia w sobie abstrakcyjnego modelu �rodowiska, w kt�rym jest umieszczona. Gdyby napotkano problem, m�g�by najpierw zbada� rozwi�zania w ramach wewn�trznego abstrakcyjnego modelu �rodowiska, a nast�pnie podj�� pr�b� eksperyment�w zewn�trznych. "Podczas warsztat�w Minsky kontynuowa� prace nad szkicem, kt�ry p�niej zosta� opublikowany jako praca podstawowa, "Kroki Ku inteligencji sztucznej. "Jednym z najwa�niejszych technicznych wk�ad�w ze spotkania w 1956 r. By�a praca Newella i Simona nad ich programem" Logic Theorist (LT) "s�u��cym do udowodnienia twierdze� w logice symbolicznej. LT by� konkretnym dowodem na to, �e przetwarzanie "struktury symboli "i wykorzystanie tego, co Newell i Simon nazywali "heurystyk�" by�y fundamentem inteligentnego rozwi�zywania problem�w. Opisz� niekt�re z tych pomys��w bardziej szczeg�owo w nast�pnej cz�ci. Newell i Simon pracowali nad pomys�ami na LT dla kilka miesi�cy i przekona� si� pod koniec 1955 r., �e mo�na je wcieli� w dzia�aj�cy program. Wed�ug Edwarda Feigenbauma (1936 -), kt�ry odbywa� kurs u Herb Simona w Carnegie na pocz�tku 1956 r., "To tu� po �wi�tach Bo�ego Narodzenia - stycze� 1956 r. -kiedy Herb Simon wszed� do klasy i powiedzia�: "W czasie �wi�t Allen Newell i ja wynale�li�my maszyn� my�l�c�." "To, co wkr�tce mia�o zosta� zaprogramowane jako LT, by�o maszyn� my�l�c�" Simon m�wi� o niej. Nazywa� to tak, bez w�tpienia, poniewa� my�la�, �e tak si� sta�o ,�e niekt�re z tych samych metod rozwi�zywania problem�w, z kt�rych korzystaj� ludzie. Simon napisa� p�niej: "W czwartek, 15 grudnia. Uda�o mi si� r�cznie zasymulowa� pierwszy dow�d ... Zawsze 15 grudnia 1955 roku obchodzi�em urodziny heurystycznego rozwi�zywania problem�w przez komputer". Zgodnie z autobiografi� Simona "Modele mojego �ycia" LT rozpocz�o si� od symulacji r�cznej, wykorzystuj�c swoje dzieci jako elementy komputerowe, jednocze�nie pisz�c i trzymaj�c karty notatek jako rejestry zawieraj�ce zmienne stanu programu. Kolejnym tematem omawianym w Dartmouth by� problem udowodnienia twierdze� w geometrii. (By� mo�e niekt�rzy czytelnicy przypomn� sobie swoje zmagania z dowodami geometrii w liceum). Minsky ju� my�la� o programie do udowodnienia twierdze� geometrii. McCorduck cytuje go, m�wi�c:

"Prawdopodobnie wa�nym wydarzeniem w moim rozwoju - i wyja�nieniem mojej by� mo�e zaskakuj�co przypadkowej akceptacji pracy Newella-Shawa - Simon - by�o to, �e naszkicowa�em heurystyczn� procedur� poszukiwania maszyny geometrycznej, a nast�pnie by�em w stanie poda� j� - na�laduj to na papierze w ci�gu oko�o godziny. Pod moj� r�k� powsta� nowy dow�d twierdzenia o tr�jk�cie r�wnoramiennym, dow�d, kt�ry by� nowy i elegancki dla uczestnik�w - p�niej odkryli�my, �e dow�d by� dobrze znany. . ." W lipcu 2006 r. W Dartmouth odby�a si� kolejna konferencja z okazji pi��dziesi�tej rocznicy pierwszej konferencji. Kilku za�o�ycieli i innych wybitnych badaczy sztucznej inteligencji wzi�o udzia� w ankiecie i dokona�o przegl�du tego, co osi�gni�to od 1956 r. McCarthy przypomnia�, �e g��wnym powodem warsztat�w Dartmouth w 1956 r. nie by�o spe�nienie moich oczekiwa�, poniewa� AI jest trudniejsze ni� si� spodziewali�my. , warsztaty z 1956 r. s� uwa�ane za oficjalny pocz�tek powa�nej pracy w sztucznej inteligencji, a Minsky, McCarthy, Newell i Simon zostali uznani za "ojc�w" AI. W bibliotece Baker Library w Dartmouth po�wi�cono tablic� upami�tniaj�c� pocz�tek sztucznej inteligencji jako dyscypliny naukowej.

Mechanizacja proces�w my�lowych

W listopadzie 1958 r. Sympozjum na temat "Mechanizacji Procesu My�li "odby�o si� w National Physical Laboratory w Teddington, Middlesex, Anglia. Zgodnie z przedmow� z konferencji, sympozjum odby�o si�" w celu zgromadzenia naukowc�w badaj�cych my�lenie sztuczne, rozpoznawanie znak�w i wzor�w, nauk�, mechaniczne t�umaczenie j�zyka, biologia, programowanie automatyczne, planowanie przemys�owe i mechanizacja biurowa. " W�r�d os�b, kt�re zaprezentowa�y referaty na tym sympozjum by�o wielu, o kt�rych ju� wspomnia�em w tej historii. Nale�� do nich Minsky (w�wczas cz�onek personelu w Lincoln Laboratory i na drodze do zostania profesorem matematyki na MIT), McCarthy (w�wczas asystent profesora nauk o komunikacji na MIT), Ashby, Selfridge i McCulloch. (John Backus, jeden z tw�rc�w komputerowego j�zyka programowania FORTRAN, i Grace Murray Hopper, pionier "programowania automatycznego" r�wnie� wyg�osili referaty.) Obrady tej konferencji zawieraj� artyku�y, kt�re sta�y si� bardzo wp�ywowe w historii sztucznej inteligencji. W�r�d nich wymieni� te autorstwa Minsky'ego, McCarthy'ego i Selfridge'a. Artyku� Minsky'ego "Niekt�re metody sztucznej inteligencji i programowania heurystycznego" by� najnowsz� wersj� utworu, nad kt�rym pracowa� tu� przed warsztatami w Dartmouth. W artykule opisano r�ne metody, kt�re by�y (i mog�yby by�) wykorzystane w programowaniu heurystycznym. Obejmowa� tak�e metody rozpoznawania wzorc�w, uczenia si� i planowania. Ostateczna wersja, kt�ra wkr�tce mia�a zosta� opublikowana jako "Kroki w kierunku sztucznej inteligencji", mia�a sta� si� obowi�zkow� lektur� dla nowych rekrut�w do p�l. Wspomnia�em ju� o nadziei McCarthy'ego na opracowanie j�zyka sztucznej inteligencji dla AI. Podsumowa� sw�j artyku� konferencyjny "Programy ze zdrowym rozs�dkiem" w nast�puj�cy spos�b:

"W tym artykule om�wione zostan� programy do manipulacji w odpowiednim j�zyku formalnym (najprawdopodobniej cz�� rachunku predykat�w) typowymi stwierdzeniami instrumentalnymi. Program podstawowy wyci�gnie natychmiastowe wnioski z listy przes�anek. Wnioski te b�d� zdaniami deklaratywnymi lub imperatywnymi. Kiedy wydane zostanie zdanie rozkazuj�ce, program podejmuje odpowiednie dzia�anie. " W swoim artykule McCarthy zasugerowa�, �e fakty potrzebne programowi AI, kt�ry nazwa� "przyjmuj�cym porady", mo�e by� reprezentowany jako wyra�enie w matematycznym (i przyjaznym dla komputera) j�zyku zwanym "logik� pierwszego rz�du". Na przyk�ad fakty "Jestem przy biurku" i "Moje biurko jest w domu" by�yby reprezentowane jako wyra�enia na (ja, biurko) i na (biurko, dom). Te, wraz z podobnie reprezentowanymi informacjami o tym, jak osi�gn�� zmian� lokalizacji (na przyk�ad pieszo i samochodem), mog� by� nast�pnie wykorzystane przez proponowanego (ale jeszcze nie zaprogramowanego) doradc�, aby dowiedzie� si�, jak osi�gn�� jaki� cel, taki jak b�d�c na lotnisku. Proces wnioskowania doradcy wytworzy�yby logiczne wyra�enia, kt�re wymaga�yby przej�cia do samochodu i jazdy na lotnisko. Reprezentowanie fakt�w w j�zyku logicznym ma kilka zalet. Jak to p�niej uj�� McCarthy:

"Wyra�anie informacji w zdaniach deklaratywnych jest o wiele bardziej modu�owe ni� wyra�anie ich w segmentach programu komputerowego lub w tabelach. Zdania mog� by� prawdziwe w znacznie szerszych kontekstach, ni� konkretne programy mog� by� przydatne. Dostawca faktu nie musi wiele rozumie� na temat jak dzia�a odbiorca lub jak lub czy b�dzie go u�ywa�. Ten sam fakt mo�na wykorzysta� do wielu cel�w, poniewa� logiczne konsekwencje zbior�w fakt�w mog� by� dost�pne " McCarthy rozwin�� te pomys�y w memorandum towarzysz�cym. Jak wspomn� p�niej, niekt�re z propozycji McCarthy'ego zosta�y ostatecznie wdro�one przez absolwenta Stanforda, C. Cordella Greena. Wspomnia�em ju� o pracy Olivera Selfridge'a z rozpoznawaniem wzor�w w 1955 roku. Na sympozjum Teddington w 1958 r. Selfridge przedstawi� artyku� na temat nowego modelu rozpoznawania wzorc�w (i prawdopodobnie tak�e innych zada� poznawczych). Nazwa� go "Pandemonium", co oznacza miejsce wszystkich demon�w. Jego model jest szczeg�lnie interesuj�cy, poniewa� jego komponenty, kt�re Selfridge nazywa "demonami", mog� by� tworzone zar�wno jako spe�niaj�ce funkcje kom�rek nerwowych ni�szego poziomu, jak i funkcje poznawcze wy�szego poziomu (odmiany przetwarzaj�cej symbole). Tak wi�c Pandemonium mo�e przybiera� form� sieci neuronowej, hierarchicznie zorganizowanego zestawu procesor�w symboli {wszystkie pracuj�ce r�wnolegle lub jakiej� kombinacji tych form. Je�li to drugie, model jest prowokuj�c� propozycj� po��czenia tych dw�ch odmiennych podej�� do sztucznej inteligencji. We wst�pie do swojej pracy Selfridge podkre�li� znaczenie oblicze� wykonywanych r�wnolegle:

"Podstawowym motywem naszego modelu jest koncepcja przetwarzania r�wnoleg�ego. Sugeruje si� to z dw�ch powod�w: po pierwsze, cz�sto �atwiej jest przetwarza� dane w spos�b r�wnoleg�y i rzeczywi�cie jest to zwykle bardziej naturalny spos�b post�powania to w; a po drugie, �atwiej jest zmodyfikowa� zesp� quasi-niezale�nych modu��w ni� maszyna, kt�rej wszystkie cz�ci wchodz� w interakcj� natychmiastowo i w z�o�ony spos�b ".

Selfridge przedstawi� kilka sugestii dotycz�cych tego, jak Pandemonium mo�e si� uczy�. Warto opisa� niekt�re z nich, poniewa� zapowiadaj� p�niejsz� prac� w uczeniu maszynowym. Ale najpierw musz� powiedzie� nieco wi�cej o strukturze Pandemonium. Struktura Pandemonium przypomina schemat organizacyjny firmy. Na najni�szym poziomie s� pracownicy, kt�rych Selfridge nazwa� "demonami danych". S� to procesy obliczeniowe, kt�re "patrz� na" dane wej�ciowe, powiedzmy obraz drukowanej litery lub cyfry. Ka�dy demon szuka czego� konkretnego na obrazie, by� mo�e poziomego paska; inny mo�e szuka� pionowego paska; inny dla �uku ko�a i tak dalej. Ka�dy demon "krzyczy" swoimi ustaleniami do zestawu demon�w znajduj�cych si� wy�ej w organizacji. (Pomy�l o tych demonach na wy�szych szczeblach jako mened�erach �redniego szczebla). G�o�no�� krzyku demona zale�y od tego, jak pewne jest to, �e widzi to, czego szuka. Oczywi�cie Selfridge m�wi metaforycznie, kiedy u�ywa okre�le� takich jak "szuka" i "krzyczy". Wystarczy powiedzie�, �e programowanie komputer�w nie jest zbyt trudne szukaj "pewnych cech na obrazie. (Selfridge ju� pokaza�, jak mo�na to zrobi� w swoim artykule z 1955 r., o kt�rym wspomina�em wcze�niej). A" krzyk "jest tak naprawd� si�� wyj�ciow� procesu obliczeniowego. Ka�dy z nast�pnych poziom demon�w specjalizuje si� w s�uchaniu okre�lonej kombinacji krzyku z demon�w danych. Na przyk�ad jeden z demon�w na tym poziomie mo�e zosta� dostrojony, aby nas�uchiwa� okrzyk�w danych demon 3, demon danych 11 i demon danych 22. Je�li oka�e si�, �e te konkretne demony krzycz� g�o�no, odpowiada w�asnym krzykiem demonom o jeden poziom wy�ej w hierarchii i tak dalej. Tu� poni�ej najwy�szego poziomu organizacji znajduj� si� tak zwane przez Selfridge "demony poznawcze". Podobnie jak na innych poziomach, s�uchaj� one okre�lonych kombinacji okrzyk�w demon�w na ni�szym poziomie i odpowiadaj� w�asnymi okrzykami na ostatecznego "demona decyzyjnego" na g�rze - og�lnego bossa. W zale�no�ci od tego, co s�yszy od swojego "personelu", demon decyzji ostatecznie og�asza, co uwa�a za to�samo�� obrazu {by� mo�e litera "A" lub litera "R" lub cokolwiek innego. Rzeczywisty projekt demona zale�y od tego, jakie zadanie ma wykona� Pandemonium. Ale nawet bez sprecyzowania, co ma zrobi� ka�dy demon, Selfridge przedstawi� bardzo interesuj�ce propozycje dotycz�ce tego, jak Pandemonium mo�e nauczy� si� osi�ga� lepsze wyniki we wszystkim, co powinno robi�. Jedna z jego propozycji dotyczy�a wyposa�enia ka�dego demona w co�, co stanowi�o "megafon", przez kt�ry wyda� sw�j okrzyk. Poziom g�o�no�ci megafonu mo�na regulowa�. (Pandemonium Selfridge'a jest nieco bardziej skomplikowane ni� wersja, kt�r� opisuj�. W jego wersji ka�dy demon u�ywa r�nych kana��w do komunikowania si� z ka�dym z r�nych demon�w powy�ej. G�o�no�� krzyku dochodz�cego do ka�dego kana�u jest indywidualnie dostosowywana przez nauk� mechanizm). Demonom nie wolno by�o jednak ustawia� w�asnego poziomu g�o�no�ci. Wszystkie poziomy g�o�no�ci mia�y zosta� ustawione w procesie uczenia si� zewn�trznego, kt�ry ma na celu popraw� wydajno�ci ca�ego zestawu. Wyobra� sobie, �e poziomy g�o�no�ci s� pocz�tkowo ustawiane losowo lub wed�ug tego, co wed�ug projektant�w b�dzie odpowiednie. Nast�pnie urz�dzenie jest testowane na pewnej pr�bce danych wej�ciowych i odnotowywana jest jego ocena wydajno�ci. Powiedzmy, �e dostaje wynik 81%. Nast�pnie dokonuje si� drobnych korekt poziom�w g�o�no�ci na wszystkie mo�liwe sposoby, a� do znalezienia zestawu korekt, kt�ry najbardziej poprawi wynik, powiedzmy do 83%. Ten szczeg�lny zestaw drobnych korekt jest nast�pnie wprowadzany, a proces jest powtarzany w k�ko (by� mo�e w przypadku dodatkowych danych), dop�ki nie b�dzie mo�na dokona� dalszej poprawy. (Poniewa� w organizacji mo�e by� wiele megafon�w, wprowadzanie korekt na wszystkie mo�liwe sposoby i testowanie ka�dego z tych sposob�w w celu znalezienia wyniku mo�e wydawa� si� niepraktyczne. Proces mo�e rzeczywi�cie zaj�� troch� czasu, ale komputery s� szybkie {nawet tym bardziej dzisiaj. P�niej poka��, jak to zrobi� ,mo�emy obliczy�, a nie eksperymentalnie, najlepsze poprawki, kt�re nale�y wprowadzi� w sieciach neuronowych zorganizowanych jak Pandemonium.) Je�li my�limy o wyniku jako wysoko�ci jakiego� krajobrazu i dostosowaniach jako ruchach nad krajobrazem, proces ten mo�na por�wna� do wspinaczki wzg�rze, zawsze wykonuj�c kroki w kierunku najbardziej stromego wej�cia. Gradient wspinaczka (lub metody wspinaczki, jak si� je czasami nazywa) s� dobrze znane w matematyce. Selfridge mia� do powiedzenia na temat niekt�rych pu�apek ich u�ywania:

"Mo�na to opisa� jako jeden z problem�w treningu, a mianowicie zach�cenie maszyny lub organizmu do wystarczaj�cej ilo�ci stok�w, aby niewielkie zmiany. . . spowoduje zauwa�aln� popraw� jego wysoko�ci lub wyniku. Mo�na opisa� sytuacje uczenia si�, w kt�rych wi�kszo�� trudno�ci w zadaniu polega na znalezieniu jakiegokolwiek sposobu poprawy swojego wyniku, na przyk�ad na uczeniu si� jazdy na monocyklu, gdzie utrzymanie si� przez sekund� trwa d�u�ej ni� poprawa tego sekunda do minuty; i inne, w kt�rych �atwo jest zrobi� troch� dobrze, a bardzo dobrze, na przyk�ad nauczy� si� gra� w szachy. Prawd� jest r�wnie� to, �e cz�sto g��wnym szczytem jest p�askowy�, a nie izolowany szczyt."
Selfridge opisa� inn� metod� uczenia si� w Pandemonium. Metod� t� mo�na por�wna� do zast�powania mened�er�w w organizacji, kt�ra nie osi�ga dobrych wynik�w. Jak to uj�� Selfridge, przy koncepcji naszego demonicznego zgromadzenia zebrali�my nieco arbitralnie du�� liczb� subdemon�w, kt�re naszym zdaniem by�yby przydatne. . . ale nie mamy �adnej pewno�ci, �e wybrane przez nas pod-demony s� dobre. Wyb�r subdemon�w generuje nowe subdemony do pr�b i eliminuje te nieefektywne, czyli takie, kt�re niewiele pomagaj� poprawi� wynik. Proces selekcji demon�w rozpoczyna si� po pewnym czasie dzia�ania mechanizmu uczenia si� dostosowuj�cego g�o�no��, bez dalszej poprawy wynik�w. Nast�pnie "warto��" ka�dego demona jest oceniana przy u�yciu, jak sugeruje Selfridge, metody opartej na wyuczonym poziomie g�o�no�ci ich krzyk�w. Demony o wysokim poziomie g�o�no�ci maj� du�y wp�yw na ko�cowy wynik i dlatego mo�na uzna�, �e maj� du�� warto��. Po pierwsze, demony o niskim poziomie g�o�no�ci s� ca�kowicie eliminowane. (Ten krok nie mo�e bardzo zaszkodzi� wynikowi.) Nast�pnie niekt�re demony przechodz� losowo "mutacje "i s� ponownie wprowadzane do u�ytku. Nast�pnie wybrane s� niekt�re pary godnych demon�w i, jak m�wi Selfridge," sprz�one " w demony potomk�w. Precyzyjna metoda koniugacji Selfridge zaproponowana tutaj nie musi nas dotyczy�, ale duchem tego procesu jest wytwarzanie potomstwa, kt�re, jak mo�na si� spodziewa�, ma u�yteczne w�a�ciwo�ci rodzic�w. Potomstwo zostaje nast�pnie oddane do u�ytku. Teraz ca�y proces dostosowywania poziom�w g�o�no�ci ocala�ych i "ewoluuj�cych" demon�w mo�e rozpocz�� si� od nowa, aby sprawdzi�, czy wynik nowego zestawu mo�na jeszcze poprawi�.

Rozpoznawanie wzorc�w

Wi�kszo�� uczestnik�w letniego projektu Dartmouth by�a zainteresowana na�ladowaniem wy�szych poziom�w ludzkiej my�li. Ich praca polega�a na pewnej introspekcji dotycz�cej tego, jak ludzie rozwi�zuj� problemy. Jednak wiele naszych zdolno�ci umys�owych wykracza poza nasz� zdolno�� introspekcji. Nie wiemy, jak rozpoznajemy d�wi�ki mowy, czytamy kursyw�, odr�niamy fili�ank� od talerza lub identyfikujemy twarze. Robimy te rzeczy automatycznie, nie my�l�c o nich. Nie maj�c wskaz�wek z introspekcji, wcze�ni badacze zainteresowani automatyzacj� niekt�rych naszych zdolno�ci percepcyjnych oparli swoj� prac� na intuicyjnych pomys�ach dotycz�cych post�powania, na sieci prostych modeli neuron�w i na technikach statystycznych. P�niej pracownicy uzyskali dodatkowe informacje z bada� neurofizjologicznych dotycz�cych widzenia zwierz�t. W tej cz�ci opisz� prac� z lat 50. i 60. XX wieku nad tzw. rozpoznawaniem wzorc�w. To zdanie odnosi si� do procesu analizy obrazu wej�ciowego, segmentu mowy, sygna�u elektronicznego lub innej pr�bki danych i zaklasyfikowanie go do jednej z kilku kategorii. Na przyk�ad do rozpoznawania znak�w kategorie odpowiada�yby kilkudziesi�ciu literom alfanumerycznym. Wi�kszo�� prac nad rozpoznawaniem wzor�w w tym okresie dotyczy�a materia��w dwuwymiarowych, takich jak drukowane strony lub zdj�cia. Mo�na by�o ju� skanowa� obrazy w celu przekszta�cenia ich w tablice liczb (zwanych p�niej "pikselami"), kt�re nast�pnie mog�y by� przetwarzane przez programy komputerowe, takie jak Dinneen i Selfridge. Russell Kirsch i wsp�pracownicy z National Bureau of Standards (obecnie Narodowy Instytut Standard�w i Technologii) r�wnie� by� jednym z pierwszych pionier�w przetwarzania obrazu. W 1957 r. Kirsch zbudowa� skaner b�bnowy i wykorzysta� go do zeskanowania zdj�cia swojego trzymiesi�cznego syna Waldena. M�wi si�, �e jest to pierwsza zeskanowana fotografia, mierz�ca 176 pikseli z boku. Za pomoc� swojego skanera eksperymentowa� z programami do obr�bki zdj�� dzia�aj�cymi na komputerze SEAC (Standards Eastern Automatic Computer).

Rozpoznawanie znak�w

Wczesne starania o postrzeganie obraz�w wizualnych koncentrowa�y si� na rozpoznawaniu znak�w alfanumerycznych na dokumentach. Pole to sta�o si� znane jako "optyczne rozpoznawanie znak�w". Sympozjum po�wi�cone informowaniu o post�pach w tym temacie odby�o si� w Waszyngtonie w styczniu 1962 r. Podsumowuj�c, w tym czasie istnia�y urz�dzenia umo�liwiaj�ce do�� dok�adne rozpoznawanie czcionek sta�ych (pisanych na maszynie lub drukowanych) na papierze. By� mo�e stan rzeczy najlepiej wyrazi� jeden z uczestnik�w sympozjum, J. Rabinow z Rabinow Engineering, kt�ry powiedzia�: "W naszej firmie my�limy, �e mo�emy przeczyta� wszystko, co jest drukowane, a nawet niekt�re rzeczy, kt�re s� napisane. Jedynym haczykiem jest to, ile dolar�w trzeba wyda�? ". Znacz�cym sukcesem w latach 50. by� system rozpoznawania atramentu magnetycznego (MICR) opracowany przez naukowc�w z SRI International (zwany w�wczas Stanford Research Institute) do czytania stylizowanych znak�w atramentu magnetycznego na dole czek�w. MICR by� cz�ci� systemu SRI ERMA (Electronic Recording Method of Accounting) s�u��cego do automatyzacji przetwarzania czek�w oraz zarz�dzania rachunkami i zarz�dzania ksi�gowaniem. Wed�ug strony internetowej SRI "W kwietniu 1956 r. Bank of Ameryka og�osi�a, �e General Electric Corporation zosta�a wybrana do produkcji modeli produkcyjnych ... W 1959 r. General Electric dostarczy� pierwsze 32 systemy obliczeniowe ERMA do Bank of America. ERMA s�u�y� jako komputer ksi�gowy i system obs�ugi czek�w do 1970 r" . Wi�kszo�� metod rozpoznawania w tym czasie polega�a na dopasowaniu znaku (po jego wyizolowaniu na stronie i przekonwertowaniu go na tablic� zer i jedynek) z prototypowymi wersjami znaku zwanymi "szablonami" (r�wnie� przechowywanymi jako tablice na komputerze) . Je�li znak pasuje do szablonu dla "A", powiedzmy, wystarczaj�co lepiej ni� inne szablony, dane wej�ciowe zosta�y zadeklarowane jako "A." Dok�adno�� rozpoznania uleg�a pogorszeniu, je�li znaki wej�ciowe nie by�y prezentowane w standardowej orientacji, nie by�y tej samej czcionki co szablon lub mia�y niedoskona�o�ci. Artyku�y z 1955 r autorstwa Selfridge i Dinneen zaproponowa�y kilka pomys��w na wyj�cie poza dopasowywanie szablon�w. Praca Olivera Selfridge'a i Ulricha Neissera z 1960 r. posun�a t� prac� dalej. Ten artyku� jest wa�ny, poniewa� by� udan�, wczesn� pr�b� u�ycia przetwarzania obrazu, ekstrakcji funkcji i wyuczonych warto�ci prawdopodobie�stwa w rozpoznawaniu znak�w odr�cznie wydrukowanych. Znaki zosta�y zeskanowane i przedstawione na "siatk�wce" 32 x 32 lub tablicy zer i jedynek. Zosta�y one nast�pnie przetworzone przez r�ne operacje odnawiania (podobne do tych, o kt�rych wspomina�em w zwi�zku z artyku�em Dinneena z 1955 r.) W celu usuni�cia przypadkowych kawa�k�w szumu, luk, linii pogrubienia i wzmocnienia kraw�dzi. "Oczyszczone" obrazy zosta�y nast�pnie sprawdzone pod k�tem wyst�powania "cech" (podobnych do cech, o kt�rych wspomnia�em w zwi�zku z artyku�em Selfridgea z 1955 r.). W sumie u�yto 28 funkcji -takich jak maksymalna liczba przypadk�w linia pozioma przecina�a obraz, wzgl�dne d�ugo�ci r�nych kraw�dzi i czy obraz mia� "wkl�s�o�� skierowan� na po�udnie". Przywo�uj�c system Pandemonium Selfridge′a, mo�emy my�le� o procesie wykrywania cech jako wykonywanym przez "demony". Na wy�szym poziomie hierarchii ni� demony cechowe by�y "demony rozpoznaj�ce" - po jednym na ka�d� liter�. (Wersja tego systemu przetestowana przez Worthie Doyle z Lincoln Laboratory zosta�a zaprojektowana do rozpoznawania dziesi�ciu r�nych r�cznie drukowanych znak�w, a mianowicie: A, E, I, L, M, N, O, R, S i T.) Ka�de rozpoznanie demon otrzyma� jako dane wej�ciowe od ka�dego z demon�w wykrywaj�cych cechy. Ale po pierwsze, dane wej�ciowe do ka�dego demona rozpoznaj�cego zosta�y pomno�one przez wag�, kt�ra uwzgl�dnia�a znaczenie wk�adu odpowiedniej cechy w podejmowaniu decyzji. Na przyk�ad, je�li cecha 17 by�a wa�niejsza ni� cecha 22 przy podejmowaniu decyzji, �e znakiem wej�ciowym jest "A", w�wczas dane wej�ciowe do rozpoznaj�cego "A" z cechy 17 by�yby wa�one bardziej ni� dane wej�ciowe z cechy. Po tym, jak ka�dy demon rozpoznania zsumowa� sum� swoich wa�onych danych wej�ciowych, ostateczny "demon decyzyjny" zdecydowa� na korzy�� tego, �e posta� ma najwi�ksz� sum�. Warto�ci wag zosta�y okre�lone w procesie uczenia si�, podczas kt�rego analizowano 330 obraz�w "treningowych". Zliczenia zestawiono w tabelach, ile razy wykryto ka�d� cech� dla ka�dej innej litery w zestawie szkoleniowym. Te dane statystyczne wykorzystano do oszacowania prawdopodobie�stwa wykrycia danej cechy dla ka�dej litery. Te oszacowania prawdopodobie�stwa wykorzystano nast�pnie do wa�enia cech sumowanych przez rozpoznaj�ce demony. Po szkoleniu system zosta� przetestowany na pr�bkach r�cznie drukowanych znak�w, kt�rych jeszcze nie widzia�. Wed�ug Selfridge′a i Neissera: "Ten program sprawia, �e tylko oko�o 10 procent mniej jest poprawnych identyfikacji, ni� czytelnicy ludzcy robi� {na pewno przyzwoit� wydajno��."

Sieci neuronowe

Perceptrony

W 1957 r. Frank Rosenblatt (1928-1969, psycholog z Cornell Aeronautical Laboratory w Buffalo w stanie Nowy Jork) rozpocz�� prac� nad sieciami neuronowymi w ramach projektu o nazwie PARA (Perceiving and Recognizing Automaton). Motywowa� go wcze�niejsza praca McCullocha. Pitts i Hebb zainteresowali si� tymi sieciami, kt�re nazwa� perceptronami, jako potencjalnymi modelami ludzkiego uczenia si�, poznania i pami�ci. Kontynuuj�c na pocz�tku lat 60. jako profesor na Cornell University w Ithaca w Nowym Jorku, eksperymentowa� z wieloma r�nych rodzaj�w perceptron�w. Jego praca, bardziej ni� Clarka i Farleya oraz innych pionier�w sieci neuronowych, by�a odpowiedzialna za zainicjowanie jednej z g��wnych alternatyw dla metod przetwarzania symboli w AI, a mianowicie sieci neuronowych. Perceptrony Rosenblatta sk�ada�y si� z McCulloch {Elementy neuronowe w stylu Pittsa, takie jak ten pokazany poni�ej

Ka�dy element mia� dane wej�ciowe (przychodz�ce od lewej strony w g�r�), \ wagi "(pokazane przez wybrzuszenia na liniach wej�ciowych) i jedno wyj�cie (wychodz�ce w prawo). Dane wej�ciowe mia�y warto�ci 1 lub 0, i ka�de wej�cie zosta�o pomno�one przez zwi�zan� z nim warto�� wagi. Element neuronowy obliczy� sum� tych wa�onych warto�ci. Na przyk�ad, je�li wszystkie dane wej�ciowe do elementu neuronowego na rysunku by�y r�wne 1, suma wynosi�aby 13. Gdyby suma by�a wi�ksza ni� (lub po prostu r�wna) "warto�� progowa", powiedzmy 7, powi�zana z elementem, w�wczas dane wyj�ciowe elementem neuronowym b�dzie 1, co by�oby w tym przyk�adzie. W przeciwnym razie wynik wyni�s�by 0. Perceptron sk�ada si� z sieci tych element�w neuronowych, w kt�rych wyj�cia jednego elementu s� danymi wej�ciowymi dla innych. (Jest tu analogia do Pandemonium Selfridge'a, w kt�rym demony �redniego poziomu otrzymuj� "krzyki" demony ni�szego poziomu. Ci�ary na liniach wej�ciowych elementu neuronowego mo�na traktowa� jako analogiczne do "kontroli si�y" zwi�kszaj�cej lub zmniejszaj�cej si�� w Pandemonium.) Przyk�adowy perceptron pokazano poni�ej.

[Rosenblatt narysowa� schematy perceptron�w w formacie poziomym (styl elektrotechniczny), z wej�ciami po lewej i wyj�ciami po prawej. Tutaj u�ywam stylu pionowego og�lnie preferowanego przez informatyk�w do hierarchii, z najni�szym poziomem u do�u i najwy�szym u g�ry. Aby upro�ci� schemat, wybrzuszenia wagi nie s� pokazane.] Chocia� przedstawiony perceptron, z tylko jedn� jednostk� wyj�ciow�, jest zdolny tylko do dw�ch r�nych wyj�� (1 lub 0), wiele wyj�� (zestawy 1 i 0) mo�na uzyska� przez u�o�enie dla kilku jednostek wyj�ciowych. Warstwa wej�ciowa, pokazana na dole rysunku, by�a zazwyczaj prostok�tnym uk�adem 1 i 0 odpowiadaj�cych kom�rkom zwanym "pikselami" czarno-bia�ego obrazu. Jedn� z aplikacji, kt�rymi interesowa�a si� Rosenblatt, by�o, podobnie jak Selfridge, rozpoznawanie znak�w. U�yj� prostej algebry i geometrii, aby pokaza�, jak elementy neuronowe w sieciach perceptronowych mo�na "szkoli�" w celu uzyskania po��danych wynik�w. Rozwa�my na przyk�ad pojedynczy element neuronowy, kt�rego danymi wej�ciowymi s� warto�ci x₁, x₂ i x₃ i kt�rych powi�zanymi warto�ciami wagowymi s� w₁, w₂ i w₃. Gdy suma obliczona przez ten element jest dok�adnie r�wna jego warto�ci progowej, powiedzmy t, mamy r�wnanie w₁x₁ + w₂x₂ + w₃x₃ = t: W algebrze takie r�wnanie nazywa si� r�wnaniem "liniowym. "Okre�la granic� liniow�, czyli p�aszczyzn�, w przestrzeni tr�jwymiarowej. P�aszczyzna oddziela te warto�ci wej�ciowe, kt�re spowodowa�yby, �e element neuronowy mia�by wynik 1 z tych, kt�re spowodowa�yby, �e mia�by wynik 0. Pokazuj� typow� p�ask� granic� na rysunku

Wej�cie do elementu neuronowego mo�e by� przedstawione jako punkt (to znaczy wektor) w tej tr�jwymiarowej przestrzeni. Jego wsp�rz�dne to warto�ci x ₁, x ₂ i x ₃, z kt�rych ka�da mo�e wynosi� 1 lub 0. Gure pokazuje sze�� takich punkt�w, trzy z nich (powiedzmy ma�e k�ka) powoduj�ce, �e element ma moc wyj�ciow� 1, a trzy (powiedzmy ma�e kwadraty) powoduj�ce, �e ma moc wyj�ciow� 0. Zmiana warto�ci progu powoduje, �e p�aszczyzna porusza� si� na boki w kierunku r�wnoleg�ym do siebie. Zmiana warto�ci ci�ar�w powoduje obr�t p�aszczyzny. Tak wi�c, zmieniaj�c warto�ci ci�aru, punkty, kt�re kiedy� znajdowa�y si� po jednej stronie p�aszczyzny, mog�y sko�czy� si� po drugiej stronie. "Szkolenie" odbywa si� poprzez wykonanie takich zmian. B�d� mia� wi�cej do powiedzenia na temat procedur szkoleniowych. W wymiarach wi�kszych ni� trzy (co zwykle ma miejsce), liniowa granica nazywana jest "hiperp�aszczyzn�". Chocia� nie jest mo�liwe zwizualizowanie tego, co dzieje si� w przestrzeniach o du�ych wymiarach, matematycy wci�� m�wi� o punktach wej�ciowych w tych przestrzeniach oraz obrotach i ruchach hiperp�aszczyzn w odpowiedzi na zmiany warto�ci wag i prog�w. Rosenblatt zdefiniowa� kilka rodzaj�w perceptron�w. Nazwa� ten pokazany na schemacie "czteropow�okowym perceptronem sprz�onym szeregowo". (Rosenblatt liczy� dane wej�ciowe jako pierwsz� warstw�.) Nazywano to "sprz�eniem szeregowym", poniewa� moc wyj�ciowa ka�dego elementu neuronowego przekazywana by�a do element�w neuronowych w kolejnej warstwie. W najnowszej terminologii zamiast wyra�enia "sprz�ony szeregowo" u�yto wyra�enia "informacje zwrotne". Natomiast perceptron "sprz�ony krzy�owo" mo�e mie� wyj�cia element�w neuronowych w jednej warstwie jako dane wej�ciowe do element�w neuronalnych w tej samej warstwie. Perceptron sprz�ony "krzy�owo" mo�e mie� dane wyj�ciowe element�w neuronowych w jednej warstwie elementy neuronowe w warstwach o ni�szych numerach. Rosenblatt pomy�la� o swoich perceptronach jako o modelach okablowania cz�ci m�zgu. Z tego powodu nazwa� elementy neuronowe we wszystkich warstwach, ale w warstwie wyj�ciowej, "jednostkami asocjacji" (A-units), poniewa� zamierza� je modelowa� asocjacje wykonywane przez sieci neuron�w w m�zgu. Szczeg�lnie interesuj�ce by�y badania Rosenblatta to, co nazwa� "perceptronem alfa". Sk�ada�o si� z tr�jwarstwowej sieci sprz�enia zwrotnego z warstw� wej�ciow�, warstw� asocjacyjn� i jedn� lub wi�cej jednostkami wyj�ciowymi. W wi�kszo�ci jego eksperyment�w dane wej�ciowe mia�y warto�ci 0 lub 1, odpowiadaj�ce czarnym lub bia�ym pikselom na obrazie wizualnym przedstawionym na tak zwanej "siatk�wce". Ka�da jednostka A otrzyma�a dane wej�ciowe (kt�re nie zosta�y pomno�one przez warto�ci masy) z jakiego� losowo wybranego podzbioru pikseli i wys�a�a sw�j wynik , poprzez zestawy regulowanych wag, do ko�cowych jednostek wyj�ciowych, kt�rych warto�ci binarne mo�na interpretowa� jako kod dla kategorii obrazu wej�ciowego. Pr�bowano zastosowa� r�ne "procedury szkoleniowe" w celu dostosowania wag jednostek wyj�ciowych perceptronu alfa , W najbardziej dla tych (dla cel�w rozpoznawania wzorc�w) wagi prowadz�ce do jednostek wyj�ciowych wynosi�y korygowane tylko wtedy, gdy jednostki te pope�ni�y b��d w klasyfikacji danych wej�ciowych. Korekty by�y takie, aby wymusi� na wyj�ciu prawid�ow� klasyfikacj� dla tego konkretnego wej�cia. Ta technika, kt�ra wkr�tce sta�a si� standardem, zosta�a nazwana "procedur� korekcji b��d�w". Rosenblatt z powodzeniem wykorzysta� j� w szeregu eksperyment�w do szkolenia perceptron�w do klasyfikowania sygna��w wizualnych, takich jak znaki alfanumeryczne lub sygna��w akustycznych, takich jak d�wi�ki mowy. Profesor H. David Block, matematyk Cornell wsp�pracuj�cy z Rosenblattem, by� w stanie udowodni�, �e procedura korekcji b��d�w gwarantuje znalezienie hiperp�aszczyzny, kt�ra doskonale oddzieli zestaw danych treningowych, gdy taka hiperp�aszczyzna istnia�a. wykonane za pomoc� symulacji komputerowych, Rosenblatt wola� budowa� wersje sprz�towe swoich perceptron�w (symulacje by�y wczesne na wczesnych komputerach, co wyja�nia�o zainteresowanie budowaniem specjalnego sprz�tu perceptronowego). MARK I by� alfa-perceptronem zbudowanym w Cornell Aeronautical Laboratory pod sponsorowanie Oddzia�u System�w Informatycznych Offce of Naval Research i Rome Air Development Center. Zosta�o to publicznie zademonstrowane 23 czerwca 1960 r. MARK I u�ywa� regulator�w g�o�no�ci (zwanych przez in�ynier�w elektryk�w "potencjometrami") do wa�enia. Maj� one przymocowane do nich ma�e silniki w celu wykonania regulacji w celu zwi�kszenia lub zmniejszenia warto�ci masy. W 1959 roku Frank Rosenblatt przeni�s� swoj� prac� perceptronow� z Cornell Aeronautical Laboratory w Buffalo w stanie Nowy Jork na Cornell University, gdzie zosta� profesorem psychologii. Wraz z Blockiem i kilkoma studentami Rosenblatt kontynuowa� eksperymentalne i teoretyczne prace nad perceptronami. Jego ksi��ka Principles of Neurodynamics szczeg�owo opisuje jego teoretyczne pomys�y i wyniki eksperyment�w. Ostatni system Rosenblatta, zwany Tobermory, zosta� zbudowany jako urz�dzenie do rozpoznawania mowy. [Tobermory to imi� kota, kt�ry nauczy� si� m�wi� w The Chronicles of Clovis, grupie opowiada� Saki (H. H. Munro).] Kilka doktorant�w studenci, w tym George Nagy, Carl Kessler, R. D. Joseph i inni, uko�czyli projekty perceptronowe pod Rosenblattem w Cornell. W ostatnich latach pobytu w Cornell Rosenblatt zaj�� si� badaniem transferu pami�ci chemicznej u robak�w i innych zwierz�t {temat ca�kowicie usuni�ty z pracy nad perceptronem. Niestety, Rosenblatt zgin�� w wypadku podczas �eglugi w zatoce Chesapeake w 1969 roku. Mniej wi�cej w tym samym czasie co alfa-perceptron Rosenblatta, Woodrow W. (Woody) Bledsoe (1921 {1995) i Iben Browning (1918-1991), dwaj matematycy z Sandia Laboratories w Albuquerque w Nowym Meksyku, r�wnie� prowadzili badania nad rozpoznawaniem znak�w, kt�re wykorzystywa�y losowe pr�bki obraz�w wej�ciowych. Eksperymentowali z systemem, kt�ry wy�wietla� obrazy znak�w alfanumerycznych na mozaice 10 x 15 fotokom�rek i pr�bkowa� stany 75 losowo wybranych par fotokom�rek. Wskazuj�c, �e pomys� mo�na rozszerzy� na pr�bkowanie wi�kszych grup pikseli, powiedzmy N z nich, nazwali swoj� metod� metod� "N-krotki". Wykorzystali wyniki tego pr�bkowania do podj�cia decyzji o kategorii litery wej�ciowej

ADALINESY I MADALINES

Niezale�nie od Rosenblatt, grupa kierowana przez profesora in�ynierii elektrycznej Stanforda Bernarda Widrowa r�wnie� pracowa�a nad systemy sieci neuronowych na prze�omie lat 50. i 60. XX wieku. Widrow niedawno do��czy� do Stanford po uko�czeniu doktoratu z teorii sterowania na MIT. Chcia� wykorzysta� systemy sieci neuronowej do czego�, co nazwa� "kontrol� adaptacyjn�". Jedno z urz�dze� zbudowanych przez Widrow nazwano "ADALINE "(dla adaptacyjnej sieci liniowej). By� to pojedynczy element neuronowy, kt�rego regulowane ci�ary by�y realizowane przez prze��czalne (w ten spos�b regulowane) obwody rezystor�w. Widow i jeden z jego uczni�w, Marcian E. "Ted" Hoff Jr. (kt�ry p�niej wynalaz� pierwszy mikroprocesor w firmie Intel), opracowali regulowan� wag�, kt�r� nazywali "a" "memistor". Sk�ada� si� z grafitowego pr�ta, na kt�rym warstwa miedzi mog�a by� powlekana i nieplaterowana - zmieniaj�c w ten spos�b jej op�r elektryczny. Widrow i Hoff opracowali procedur� szkolenia dla ich elementu neuronowego ADALINE, kt�ry nazwano algorytmem adaptacyjnym najmniejszych �rednich kwadrat�w Widrowa-Hoffa. Wi�kszo�� eksperymentalnych prac Widrowa zosta�a wykonana przy u�yciu symulacji na komputerze IBM1620. Ich najbardziej skomplikowany projekt sieci nazwano "MADALINE" (dla wielu ADALINE). Procedur� szkoleniow� opracowa� dla niego w Stanford student William Ridgway.

Systemy MINOS w SRI

Sukces Rosenblatta z perceptronami w problemach z rozpoznawaniem wzorc�w doprowadzi� do wzmo�enia wysi�k�w badawczych innych os�b w celu powielenia i rozszerzenia jego wynik�w. W latach sze��dziesi�tych by� mo�e najbardziej znacz�ce prace w zakresie rozpoznawania wzorc�w z wykorzystaniem sieci neuronowych zosta�y wykonane w Stanford Research Institute w Menlo Park w Kalifornii. Tam Charles A. Rosen (1917-2002) kierowa� laboratorium, kt�re pr�bowa�o wytrawi� mikroskopijne lampy pr�niowe na pod�o�u p�przewodnikowym. Rosen spekulowa�, �e obwody zawieraj�ce te lampy mog� by� ostatecznie "pod��czone" do wykonywania przydatnych zada� przy u�yciu niekt�rych procedur szkoleniowych opisanych przez Franka Rosenblatta. SRI zatrudni�o Rosenblatta jako konsultanta do pomocy w projektowaniu eksploracyjnej sieci neuronowej. Kiedy w 1960 roku przeprowadzi�em wywiad na stanowisko w SRI, zesp� w laboratorium Rosen pod kierownictwem Alfreda E. (Teda) Brain (1923-2004) w�a�nie zako�czy� budow� ma�ej sieci neuronowej o nazwie MINOS. (W mitologii greckiej Minos by� kr�lem Krety i synem Zeusa i Europy. Po �mierci Minos by� jednym z trzech s�dzi�w w podziemiu). Brain uwa�a�, �e symulacje komputerowe sieci neuronowych s� zbyt wolne do praktycznych zastosowa�, co prowadzi do decyzji o budowie zamiast programowania. (Komputer IBM 1620 u�ywany w tym samym czasie przez grup� Widrowa w Stanford do symulacji sieci neuronowych mia� podstawowy cykl maszynowy wynosz�cy 21 mikrosekund i maksymalnie 60 000 "cyfr "pami�ci o swobodnym dost�pie.) W celu regulacji ci�ar�w MINOS zastosowa� magnetyczny urz�dzenia zaprojektowane przez Brain. Rosenblatt pozostawa� w bliskim kontakcie z SRI, poniewa� by� zainteresowany wykorzystaniem tych urz�dze� magnetycznych jako zamiennik�w swoich potencjometr�w nap�dzanych silnikiem. Entuzjazm i optymizm Rosen odno�nie potencja�u sieci neuronowych pom�g� mu do��czy� do SRI. Po moim przybyciu w lipcu 1961 r. dosta� szkic ksi��ki Rosenblatta do przeczytania. Zesp� Brain dopiero zaczyna� prace nad budow� du�ej sieci neuronowej, zwanej MINOS II, kontynuacj� mniejszego systemu MINOS. wspierany przede wszystkim przez Korpus Sygna�owy Armii USA w latach 1958-1967. Celem pracy MINOS by�o "przeprowadzenie bada� naukowych i eksperymentalnych bada� technik i sprz�tu cechy odpowiednie do praktycznego zastosowania w graficznym przetwarzaniu danych dla potrzeb wojskowych. "G��wnym celem projektu by�o automatyczne rozpoznawanie symboli na mapach wojskowych. Podj�to r�wnie� pr�by innych zastosowa� - takich jak rozpoznawanie pojazd�w wojskowych, takich jak czo�gi, na zdj�ciach lotniczych i rozpoznawanie r�cznie drukowanych znak�w - w pierwszym etapie przetwarzania przez MINOS II obraz wej�ciowy by� replikowany 100 razy za pomoc� matrycy plastikowej 10 x 10. Ka�dy z tych identycznych obraz�w zosta� nast�pnie przes�any przez w�asn� optyczn� mask� wykrywaj�c� cechy, a �wiat�o przez mask� zosta�o wykryte przez fotokom�rk� i por�wnane z progiem. Rezultatem by� zestaw 100 warto�ci binarnych (wy��czone - w��czone). Warto�ci te stanowi�y dane wej�ciowe do zestawu 63 element�w neuronowych ("jednostek A" w terminologii Rosenblatta), ka�dy o 100 zmiennych wagach magnetycznych. 63 wyj�cia binarne z tych element�w neuronowych zosta�y nast�pnie przet�umaczone na jedn� z 64 decyzji dotycz�cych kategorii oryginalnego obrazu wej�ciowego. (Zbudowali�my 64 r�wnie odleg�e "punkty" w sze��dziesi�ciu tr�jwymiarowych przestrzeniach i przeszkolili�my sie� neuronowa, dzi�ki czemu ka�dy obraz wej�ciowy tworzy punkt bli�szy w�asnemu punktowi prototypu ni� innemu. Ka�dy z tych prototypowych punkt�w by� jedn� z 64 "sekwencji rejestru przesuwnego o maksymalnej d�ugo�ci" o 63 wymiarach). W latach 60. grupa sieci neuronowych SRI, zwana w�wczas � Grupa Learning Machines bada�a wiele r�nych organizacji sieciowych i procedur szkoleniowych. Poniewa� komputery sta�y si� zar�wno bardziej dost�pne, jak i pot�niejsze, coraz cz�ciej korzystali�my z symulacji (w r�nych centrach komputerowych) na komputerach Burroughs 220 i 5000 oraz na IBM 709 i 7090. W po�owie lat 60. otrzymali�my w�asny edytowany komputer, SDS 910 (SDS 910, opracowany w Scienti c Data Systems, by� pierwszym komputerem, w kt�rym zastosowano tranzystory krzemowe). U�yli�my tego komputera w po��czeniu z najnowsz� wersj� naszego sprz�tu sieci neuronowej (teraz z wykorzystaniem zestawu 1024 soczewek wst�pnego przetwarzania), po��czenie nazwali�my MINOS III. Jednym z najbardziej udanych rezultat�w w systemie MINOS III by�o automatyczne rozpoznawanie r�cznie drukowanych znak�w na arkuszach koduj�cych FORTRAN. (W latach 60. programy komputerowe by�y zwykle pisane r�cznie, a nast�pnie konwertowane na karty dziurkowane przez operator�w uderze� kluczowych). Pracami tymi kierowali John Munson (1939�1972), Peter Hart i Richard Duda. Neuronowa cz�� MINOS III zosta�a wykorzystana do stworzenia rankingu mo�liwych klasyfikacji dla ka�dej postaci z miar� si�y dla ka�dej postaci. Na przyk�ad, pierwszy znak napotkany w ci�gu znak�w mo�e zosta� rozpoznany przez sie� neuronow� jako �D� o sile 90 i jako �O� o sile 10. Ale akceptuj�c najbardziej pewn� decyzj� dla ka�dego znaku nie mo�e powsta� ci�g znak�w, kt�ry jest prawnym o�wiadczeniem w j�zyku FORTRAN {wskazuj�c, �e co najmniej jedna decyzja by�a b��dna (przy za�o�eniu, �e ktokolwiek napisa� o�wiadczenie na arkuszu kodowym napisa� o�wiadczenie prawne). Zaakceptowanie drugiego lub trzeciego najbardziej bezpiecznego wyboru dla niekt�rych znak�w mo�e by� wymagane do utworzenia prawid�owego ci�gu znak�w. Ca�kowit� st�Senie pe�nego ci�gu znak�w obliczono, dodaj�c stany poszczeg�lnych znak�w w ci�gu. Nast�pnie potrzebny by� spos�b uszeregowania tych liczb liczb ca�kowitych dla ka�dego z mo�liwych ci�g�w wynikaj�cych ze wszystkich r�nych wybor�w dla ka�dego znaku. Spo�r�d tego rankingu wszystkich mo�liwych ci�g�w system nast�pnie wybra� najbardziej pewny ci�g prawny. Jednak, jak napisa� Richard Duda, �Problem znalezienia pierwszego, drugiego, trzeciego� najbardziej z�o�onego ci�gu znak�w nie jest wcale trywialnym problemem�. Kluczem do skutecznego obliczenia rankingu by�o zastosowanie metody zwanej programowaniem dynamicznym. Ilustracja pr�bki oryginalnego �r�d�a i ostatecznego wyj�cia pokazano poni�ej.

Po przeszkoleniu cz�ci sieci neuronowej systemu, ca�y system (kt�ry zdecydowa� si� na najbardziej pewny ci�g prawny) by� w stanie osi�gn�� dok�adno�� rozpoznawania wynosz�c� nieco ponad 98% na du�ej pr�bce materia�u, kt�ry nie by� cz�ci� tego, na co szkolono system. Rozpoznawanie odr�cznych postaci z takim poziomem dok�adno�ci by�o znacz�cym osi�gni�ciem w latach sze��dziesi�tych. Rozszerzaj�c swoje zainteresowania poza sieci neuronowe, Learning Machines Group ostatecznie przekszta�ci�o si� w Centrum Sztucznej Inteligencji SRI, kt�re do dzi� jest wiod�cym przedsi�biorstwem badawczym zajmuj�cym si� AI.

Metody statystyczne

W latach pi��dziesi�tych i sze��dziesi�tych istnia�o kilka zastosowa� metod statystycznych do problem�w z rozpoznawaniem wzorc�w. Wiele z tych metod by�o bardzo podobnych do niekt�rych technik sieci neuronowych. Przypomnij sobie, �e wcze�niej wyja�ni�em, jak zdecydowa�, kt�ry z dw�ch ton�w b�dzie obecny w g�o�nym sygnale radiowym. Podobn� technik� mo�na zastosowa� do rozpoznawania wzor�w. Do klasyfikowania obraz�w (lub innych danych percepcyjnych) zwykle reprezentowano dane wej�ciowe za pomoc� listy wyr�niaj�cych "cech", takich jak te u�ywane przez Selfridge'′a i jego wsp�pracownik�w. Na przyk�ad w rozpoznawaniu znak�w alfanumerycznych jedn� z pierwszych cech wyodr�bniono z obrazu znaku, kt�ry ma zosta� sklasyfikowany. Zazwyczaj cechy mia�y warto�ci liczbowe, takie jak liczba razy, gdy linie o r�nych k�tach przecina�y znak lub d�ugo�� obwodu najmniejszego ko�a, kt�re ca�kowicie otacza�o znak. Wyb�r odpowiednich funkcji by� cz�sto bardziej sztuk� ni� nauk�, ale mia� kluczowe znaczenie dla dobrej wydajno�ci. Potrzebujemy troch� elementarnej notacji matematycznej, aby pom�c opisa� te statystycznie zorientowane metody rozpoznawania wzorc�w. Za��my, �e lista funkcji wyodr�bnionych ze znaku to {f₁; f₂; … ; f_i;… :; f_N}. Skr�c� t� list� za pomoc� pogrubionego symbolu X. Za��my, �e istnieje k kategorii, C₁; C₂;… ; C_i; … ; C_k, do kt�rego mo�e nale�e� znak opisany przez XU�ywaj�c regu�y Bayesa w spos�b podobny do opisanego wcze�niej, regu�a decyzyjna jest nast�puj�ca: Zdecyduj na korzy�� tej kategorii, dla kt�rej p(X |C_i)p(C_i) jest najwi�ksze, gdzie p(C_i jest prawdopodobie�stwem a priori kategorii C_i i p(p(C_ii) to prawdopodobie�stwo X dla C_i. Prawdopodobie�stwa te mo�na wywnioskowa�, zbieraj�c dane statystyczne z du�ej pr�bki znak�w. Jak wspomnia�em wcze�niej, badacze w rozpoznawaniu wzor�w cz�sto opisuj� proces decyzyjny w kategoriach geometrii. Wyobra�aj� sobie, �e warto�ci cech uzyskanych z pr�bki obrazu mo�na przedstawi� jako punkt w przestrzeni wielowymiarowej. Je�li mamy kilka pr�bek dla ka�dej powiedzmy dw�ch znanych kategorii danych, mo�emy reprezentowa� te pr�bki jako rozproszenie punkt�w w przestrzeni. W rozpoznawaniu znak�w rozproszenie mo�e wyst�pi� nie tylko dlatego, �e obraz postaci mo�e by� ha�a�liwy, ale tak�e dlatego, �e postacie z tej samej kategorii mog� by� rysowane nieco inaczej. Pokazuj� dwuwymiarowy przyk�ad z funkcjami f₁ i f₂ na rysunku.

Na podstawie rozproszenia punkt�w w ka�dej kategorii mo�emy obliczy� oszacowanie prawdopodobie�stw potrzebnych do obliczenia prawdopodobie�stw. Nast�pnie mo�emy wykorzysta� prawdopodobie�stwa i wcze�niejsze prawdopodobie�stwa do podj�cia decyzji. Pokazuj� tutaj granic�, obliczon� na podstawie prawdopodobie�stw i wcze�niejszych prawdopodobie�stw, kt�ra dzieli przestrze� na dwa regiony. W jednym regionie decydujemy si� na kategori� 1; z drugiej wybieramy kategori� 2. Pokazuj� tak�e nowy punkt funkcji, X, kt�ry ma zosta� sklasyfikowany. W tym przypadku pozycja X wzgl�dem granicy narzuca, �e klasyfikujemy X jako cz�onka kategorii 1. Istniej� r�wnie� inne metody klasyfikacji punkt�w charakterystycznych. Ciekawym przyk�adem jest metoda \ najbli�szego s�siada. W tym schemacie, wynalezionym przez E. Fixa i JL Hodgesa w 1951,nowy punkt cechy jest przypisany do tej samej kategorii, co ten przyk�adowy punkt cechy, do kt�rego jest najbli�ej. na powy�szym rysunku nowy punkt X zosta�by sklasyfikowany jako nale��cy do kategorii 2. przy u�yciu metody najbli�szego s�siada. Wa�ne opracowanie metody najbli�szego s�siada przypisuje nowy punkt do tej samej kategorii co wi�kszo�� k najbli�szych punkt�w. regu�a decyzyjna wydaje si� prawdopodobna (w przypadku, gdy istnieje wiele, wiele punkt�w pr�bnych ka�dej kategorii), poniewa� istnieje wi�cej punkt�w pr�bnych kategorii C_i bli�ej nieznanego punktu, X, ni� punkty pr�bne kategorii C_j jest dowodem, �e p(X | Ci) p (C_i) jest wi�kszy ni� p(X | C_j)) p (C_j) W oparciu o t� og�ln� obserwacj� Thomas Cover i Peter Hart rygorystycznie przeanalizowali skuteczno�� metod najbli�szego s�siedztwa. Ka�da technika rozpoznawania wzorc�w, nawet wykorzystuj�ca sieci neuronowe lub najbli�szych s�siad�w, mo�e by� uwa�ana za konstruowanie granic oddzielaj�cych w wielowymiarowej przestrzeni cech. Inn� metod� konstruowania granic przy u�yciu "funkcji potencjalnych" zasugerowali rosyjscy naukowcy M. A. Aizerman, E. M. Braverman i L. I. Rozonoer w latach 60. Niekt�re wa�ne wczesne ksi��ki na temat stosowania metod statystycznych w rozpoznawaniu wzorc�w to George Sebestyen, Richard Duda i Peter Hart. Technologia rozpoznawania wzor�w pod koniec lat 60. XX wieku zosta�a dobrze oceniona przez George'a Nagy'a (kt�ry wcze�niej by� jednym z doktorant�w Franka Rosenblatta).

Zastosowania rozpoznawania wzor�w w rozpoznaniu lotniczym Sie� neuronowa i metody statystyczne rozpoznawania wzorc�w przyci�gn�y wiele uwagi w wielu firmach z bran�y lotniczej i lotniczej na prze�omie lat 50. i 60. XX wieku. Firmy te mia�y du�y bud�et na badania i rozw�j wynikaj�ce z um�w z Departamentem Obrony USA. Wiele z nich by�o szczeg�lnie zainteresowanych problemem zwiadu powietrznego, tj. lokalizacj� i identyfikacj� "cel�w" na zdj�ciach lotniczych. W�r�d firm prowadz�cych szeroko zakrojone programy badawcze po�wi�cone temu zagadnieniu i powi�zanych z nimi problemami by� Dzia� Aeronutronic Ford Motor Co., Douglas Aircraft Company (jak wtedy by�o znane), General Dynamics, Lockheed Missiles and Space Division oraz Philco Corporation (Philco zosta� p�niej przej�ty przez Forda pod koniec 1961 r.) Wspomn� o niekt�rych pracach w Philco , Laveen N. Kanal, Neil C. Randall i Thomas Harley pracowali zar�wno nad teori�, jak i metodami statystycznego rozpoznawania wzorc�w. Opracowane przez nich systemy s�u�y�y do przegl�dania zdj�� lotniczych pod k�tem interesuj�cych cel�w wojskowych, takich jak czo�gi. ilustracja jednego z ich system�w pokazano na rysunku

Aparat Philco zeskanowa� materia� z 9-calowych negatyw�w zebranych przez samolot rozpoznawczy U2 podczas manewr�w czo�g�w armii ameryka�skiej w Fort Drum w Nowym Jorku. Niewielka cz�� zeskanowanego zdj�cia, prawdopodobnie zawieraj�ca czo�g M-48 (w standardowej pozycji i rozmiarze), zosta�a najpierw przetworzona w celu wzmocnienia kraw�dzi, a wynik zosta� przedstawiony systemowi wykrywania celu jako uk�ad zer i jedynek. Pierwszy z ich system�w u�ywa� tablicy 22 x 12; p�niej u�ywali tablicy 32 x 32, jak pokazano na powy�szym rysunku. Tablica zosta�a nast�pnie podzielona na 24 nak�adaj�ce si� 8 x 8 "blok�w cech". Dane w ka�dym bloku obiekt�w s� nast�pnie poddawane testowi statystycznemu, aby zdecydowa�, czy ma�y obszar obrazu reprezentowany przez ten blok zawiera cz�� zbiornika. Testy statystyczne oparto na "pr�bce szkoleniowej" 50 obraz�w zawieraj�cych zbiorniki i 50 pr�bek terenu niezawieraj�cego zbiornik�w. Dla ka�dego bloku cech 8 x 8 opracowano parametry statystyczne z tych pr�bek w celu ustalenia (liniowej) granicy w sze��dziesi�ciu - czterowymiarowa przestrze�, kt�ra najlepiej rozr�nia pr�bki zbiornik�w od pr�bek nieczo�gowych. Korzystaj�c z tych granic, system zosta� nast�pnie przetestowany na innym zestawie 50 obraz�w zawieraj�cych zbiorniki i 50 obraz�w niezawieraj�cych zbiornik�w. Dla ka�dego obrazu testowego liczba cech bloki decyduj�ce o "obecno�ci czo�gu" zosta�y obliczone, aby uzyska� ko�cowy "wynik" liczbowy (np. 21 z 24 blok�w zdecydowa�o, �e czo�g by� obecny). Wynik ten mo�e by� nast�pnie wykorzystany do podj�cia decyzji, czy obraz zawiera czo�g. Autorzy stwierdzili, �e "wyniki eksperymentalne procedury klasyfikacji statystycznej przekroczy�y wszelkie oczekiwania". Prawie po�owa pr�bek testowych mia�a doskona�e wyniki (to znaczy, wszystkie 24 bloki cech prawid�owo rozr�nia�y zbiornik i zbiornik). Ponadto wszystkie pr�bki testowe zawieraj�ce zbiorniki mia�y wynik wi�kszy lub r�wny 11, a wszystkie pr�bki testowe niezawieraj�ce zbiornik�w mia�y wynik mniejszy lub r�wny 7. System wczesnego wykrywania zbiornik�w w Philco zosta� zbudowany z analogowym zesp� obwod�w - nie zaprogramowany na komputerze. Jak p�niej opracowa� Thomas Harley, lider projektu tego systemu, wa�ne jest, aby pami�ta� o technologicznym kontek�cie epoki, w kt�rej ta praca zosta�a wykonana. Wdro�ony przez nas system nie mia� wbudowanych mo�liwo�ci obliczeniowych. Ci�arami liniowej funkcji dyskryminacyjnej by�y rezystory, kt�re kontrolowa�y pr�d pochodz�cy z (binarnego) �r�d�a napi�cia w elementach rejestru przesuwnego. Pr�dy te zosta�y zsumowane i ka�da cecha zosta�a rozpoznana lub nie w zale�no�ci od tego, czy suma tych pr�d�w przekroczy�a warto�� progow�. Te decyzje dotycz�ce funkcji binarnych zosta�y nast�pnie zsumowane, ponownie w analogowym obwodzie elektrycznym, a nie w komputerze, i ponownie podj�to decyzj� [zbiornik lub brak zbiornika] w zale�no�ci od tego, czy suma przekroczy�a warto�� progow� W innym systemie klasyfikacja statystyczna zosta�a wdro�ona przez program o nazwie MULTINORM, dzia�aj�cy na komputerze Philco 2000. W innych eksperymentach Philco zastosowa� dodatkowe testy statystyczne, aby w wi�kszym stopniu obliczy� niekt�re bloki cech ni� inne przy obliczaniu wyniku ko�cowego. Kanal powiedzia�, �e te eksperymenty z wa�eniem wynik�w blok�w charakterystycznych "przewidywa�y ide� klasyfikacji maszyny wektor�w no�nych (SVM) [...] przy u�yciu pierwszej warstwy do identyfikacji pr�bek szkoleniowych blisko granicy mi�dzy zbiornikami i innych czo�gi." Oczywi�cie systemy te mia�y do�� atwe zadanie. Wszystkie czo�gi by�y w standardowej pozycji i by�y ju� odizolowane na zdj�ciu. (Autorzy wspominaj� jednak o tym, w jaki spos�b system mo�na dostosowa� do radzenia sobie z czo�gami wyst�puj�cymi w dowolnej pozycji lub orientacji na obrazie. System uwa�am za interesuj�cy nie tylko ze wzgl�du na jego wydajno��, ale tak�e poniewa� jest to system warstwowy (podobny do Pandemonium i do alfa-perceptronu) i poniewa� jest to przyk�ad, w kt�rym oryginalny obraz jest podzielony na nak�adaj�ce si� podobrazy, z kt�rych ka�dy jest przetwarzany niezale�nie. Jak wspomn� p�niej, nak�adaj�ce si� podobrazy odgrywaj� znacz�c� rol� w niekt�rych modelach obliczeniowych kory nowej. Niestety raporty Philco zawieraj�ce szczeg�y tej pracy nie s� �atwo dost�pne. Co wi�cej, Philco i niekt�re inne grupy zaanga�owane w t� prac� znikn�y. Oto, co napisa� mi Tom Harley o raportach Philco i o samym Philco: Wi�kszo�� prac zwi�zanych z rozpoznawaniem wzor�w wykonanych w Philco w latach 60. XX wieku by�a sponsorowana przez Departament Obrony, a raporty nie by�y dost�pne do publicznej dystrybucji. Od tego czasu sama firma naprawd� rozp�yn�a si� w powietrzu. Firma Phil Motor zosta�a kupiona przez Ford Motor Company w 1961 r., A do 1966 r. Wyeliminowali laboratoria badawcze Philco, w kt�rych pracowa� Laveen Kanal. Ford pr�bowa� przenie�� t� ma�� grup� do rozpoznawania wzor�w do Newport Beach w Kalifornii [lokalizacja firmy Aeronutronic Division, kt�rej grupa do rozpoznawania wzor�w r�wnie� si� p�niej z�o�y�a], a kiedy wszyscy postanowili nie i��, przenie�li ich do dzia�u komunikacji i powiedzieli aby zamkn�� nasze projekty rozpoznawania wzorc�w. Laveen ostatecznie przeszed� na University of Maryland. W p�niejszych latach to, co by�o Philco, zosta�o sprzedane Loralowi, a wi�kszo�� z nich zosta�a p�niej sprzedana Lockheedowi Martinowi. Podej�cie do problem�w AI zwi�zanych z sieciami neuronowymi i technikami statystycznymi nazwano "niesymbolicznymi" w celu zestawienia ich z prac� "przetwarzania symboli" przez osoby zainteresowane udowodnieniem twierdze�, graniem w gry i rozwi�zywaniem problem�w . Te niesymboliczne podej�cia znalaz�y zastosowanie g��wnie w rozpoznawaniu wzorc�w, przetwarzaniu mowy i widzeniekomputerowe. Warsztaty i konferencje po�wi�cone szczeg�lnie tym tematom zacz�y si� w latach 60. XX wieku. Podgrupa IEEE Computer Society (podkomitet ds. Rozpoznawania wzorc�w w komitecie ds. Pozyskiwania i przekszta�cania danych) zorganizowa�a pierwsze "rozpoznawanie wzorc�w" Warsztat ", kt�ry odby� si� w Puerto Rico w pa�dzierniku 1966 r. Drugi (w kt�rym uczestniczy�em) odby� si� w Delft w Holandii w sierpniu 1968 r. W 1966 r. Ta podgrupa sta�a si� IEEE Computer Society Pattern Analysis and Machine Intelligence (PAMI) ) Komitet techniczny, kt�ry nadal organizowa� konferencje i warsztaty. Tymczasem pod koniec lat 50. i na pocz�tku lat 60. ludzie przetwarzaj�cy symbole wykonywali swoj� prac� g��wnie na MIT, na Carnegie Mellon University, IBM i na Uniwersytecie Stanforda. przejd� dalej do opisu niekt�rych z tego, co zrobili.

Historia Sztucznej InteligencjiArtificial Intelligence Experts

III.Wczesne eksploracje: lata 50. i 60. XX wieku