Rozpoznawanie wzorc�w

Wi�kszo�� uczestnik�w letniego projektu Dartmouth by�a zainteresowana na�ladowaniem wy�szych poziom�w ludzkiej my�li. Ich praca polega�a na pewnej introspekcji dotycz�cej tego, jak ludzie rozwi�zuj� problemy. Jednak wiele naszych zdolno�ci umys�owych wykracza poza nasz� zdolno�� introspekcji. Nie wiemy, jak rozpoznajemy d�wi�ki mowy, czytamy kursyw�, odr�niamy fili�ank� od talerza lub identyfikujemy twarze. Robimy te rzeczy automatycznie, nie my�l�c o nich. Nie maj�c wskaz�wek z introspekcji, wcze�ni badacze zainteresowani automatyzacj� niekt�rych naszych zdolno�ci percepcyjnych oparli swoj� prac� na intuicyjnych pomys�ach dotycz�cych post�powania, na sieci prostych modeli neuron�w i na technikach statystycznych. P�niej pracownicy uzyskali dodatkowe informacje z bada� neurofizjologicznych dotycz�cych widzenia zwierz�t. W tej cz�ci opisz� prac� z lat 50. i 60. XX wieku nad tzw. rozpoznawaniem wzorc�w. To zdanie odnosi si� do procesu analizy obrazu wej�ciowego, segmentu mowy, sygna�u elektronicznego lub innej pr�bki danych i zaklasyfikowanie go do jednej z kilku kategorii. Na przyk�ad do rozpoznawania znak�w kategorie odpowiada�yby kilkudziesi�ciu literom alfanumerycznym. Wi�kszo�� prac nad rozpoznawaniem wzor�w w tym okresie dotyczy�a materia��w dwuwymiarowych, takich jak drukowane strony lub zdj�cia. Mo�na by�o ju� skanowa� obrazy w celu przekszta�cenia ich w tablice liczb (zwanych p�niej "pikselami"), kt�re nast�pnie mog�y by� przetwarzane przez programy komputerowe, takie jak Dinneen i Selfridge. Russell Kirsch i wsp�pracownicy z National Bureau of Standards (obecnie Narodowy Instytut Standard�w i Technologii) r�wnie� by� jednym z pierwszych pionier�w przetwarzania obrazu. W 1957 r. Kirsch zbudowa� skaner b�bnowy i wykorzysta� go do zeskanowania zdj�cia swojego trzymiesi�cznego syna Waldena. M�wi si�, �e jest to pierwsza zeskanowana fotografia, mierz�ca 176 pikseli z boku. Za pomoc� swojego skanera eksperymentowa� z programami do obr�bki zdj�� dzia�aj�cymi na komputerze SEAC (Standards Eastern Automatic Computer).

Rozpoznawanie znak�w

Wczesne starania o postrzeganie obraz�w wizualnych koncentrowa�y si� na rozpoznawaniu znak�w alfanumerycznych na dokumentach. Pole to sta�o si� znane jako "optyczne rozpoznawanie znak�w". Sympozjum po�wi�cone informowaniu o post�pach w tym temacie odby�o si� w Waszyngtonie w styczniu 1962 r. Podsumowuj�c, w tym czasie istnia�y urz�dzenia umo�liwiaj�ce do�� dok�adne rozpoznawanie czcionek sta�ych (pisanych na maszynie lub drukowanych) na papierze. By� mo�e stan rzeczy najlepiej wyrazi� jeden z uczestnik�w sympozjum, J. Rabinow z Rabinow Engineering, kt�ry powiedzia�: "W naszej firmie my�limy, �e mo�emy przeczyta� wszystko, co jest drukowane, a nawet niekt�re rzeczy, kt�re s� napisane. Jedynym haczykiem jest to, ile dolar�w trzeba wyda�? ". Znacz�cym sukcesem w latach 50. by� system rozpoznawania atramentu magnetycznego (MICR) opracowany przez naukowc�w z SRI International (zwany w�wczas Stanford Research Institute) do czytania stylizowanych znak�w atramentu magnetycznego na dole czek�w. MICR by� cz�ci� systemu SRI ERMA (Electronic Recording Method of Accounting) s�u��cego do automatyzacji przetwarzania czek�w oraz zarz�dzania rachunkami i zarz�dzania ksi�gowaniem. Wed�ug strony internetowej SRI "W kwietniu 1956 r. Bank of Ameryka og�osi�a, �e General Electric Corporation zosta�a wybrana do produkcji modeli produkcyjnych ... W 1959 r. General Electric dostarczy� pierwsze 32 systemy obliczeniowe ERMA do Bank of America. ERMA s�u�y� jako komputer ksi�gowy i system obs�ugi czek�w do 1970 r" . Wi�kszo�� metod rozpoznawania w tym czasie polega�a na dopasowaniu znaku (po jego wyizolowaniu na stronie i przekonwertowaniu go na tablic� zer i jedynek) z prototypowymi wersjami znaku zwanymi "szablonami" (r�wnie� przechowywanymi jako tablice na komputerze) . Je�li znak pasuje do szablonu dla "A", powiedzmy, wystarczaj�co lepiej ni� inne szablony, dane wej�ciowe zosta�y zadeklarowane jako "A." Dok�adno�� rozpoznania uleg�a pogorszeniu, je�li znaki wej�ciowe nie by�y prezentowane w standardowej orientacji, nie by�y tej samej czcionki co szablon lub mia�y niedoskona�o�ci. Artyku�y z 1955 r autorstwa Selfridge i Dinneen zaproponowa�y kilka pomys��w na wyj�cie poza dopasowywanie szablon�w. Praca Olivera Selfridge'a i Ulricha Neissera z 1960 r. posun�a t� prac� dalej. Ten artyku� jest wa�ny, poniewa� by� udan�, wczesn� pr�b� u�ycia przetwarzania obrazu, ekstrakcji funkcji i wyuczonych warto�ci prawdopodobie�stwa w rozpoznawaniu znak�w odr�cznie wydrukowanych. Znaki zosta�y zeskanowane i przedstawione na "siatk�wce" 32 x 32 lub tablicy zer i jedynek. Zosta�y one nast�pnie przetworzone przez r�ne operacje odnawiania (podobne do tych, o kt�rych wspomina�em w zwi�zku z artyku�em Dinneena z 1955 r.) W celu usuni�cia przypadkowych kawa�k�w szumu, luk, linii pogrubienia i wzmocnienia kraw�dzi. "Oczyszczone" obrazy zosta�y nast�pnie sprawdzone pod k�tem wyst�powania "cech" (podobnych do cech, o kt�rych wspomnia�em w zwi�zku z artyku�em Selfridgea z 1955 r.). W sumie u�yto 28 funkcji -takich jak maksymalna liczba przypadk�w linia pozioma przecina�a obraz, wzgl�dne d�ugo�ci r�nych kraw�dzi i czy obraz mia� "wkl�s�o�� skierowan� na po�udnie". Przywo�uj�c system Pandemonium Selfridge′a, mo�emy my�le� o procesie wykrywania cech jako wykonywanym przez "demony". Na wy�szym poziomie hierarchii ni� demony cechowe by�y "demony rozpoznaj�ce" - po jednym na ka�d� liter�. (Wersja tego systemu przetestowana przez Worthie Doyle z Lincoln Laboratory zosta�a zaprojektowana do rozpoznawania dziesi�ciu r�nych r�cznie drukowanych znak�w, a mianowicie: A, E, I, L, M, N, O, R, S i T.) Ka�de rozpoznanie demon otrzyma� jako dane wej�ciowe od ka�dego z demon�w wykrywaj�cych cechy. Ale po pierwsze, dane wej�ciowe do ka�dego demona rozpoznaj�cego zosta�y pomno�one przez wag�, kt�ra uwzgl�dnia�a znaczenie wk�adu odpowiedniej cechy w podejmowaniu decyzji. Na przyk�ad, je�li cecha 17 by�a wa�niejsza ni� cecha 22 przy podejmowaniu decyzji, �e znakiem wej�ciowym jest "A", w�wczas dane wej�ciowe do rozpoznaj�cego "A" z cechy 17 by�yby wa�one bardziej ni� dane wej�ciowe z cechy. Po tym, jak ka�dy demon rozpoznania zsumowa� sum� swoich wa�onych danych wej�ciowych, ostateczny "demon decyzyjny" zdecydowa� na korzy�� tego, �e posta� ma najwi�ksz� sum�. Warto�ci wag zosta�y okre�lone w procesie uczenia si�, podczas kt�rego analizowano 330 obraz�w "treningowych". Zliczenia zestawiono w tabelach, ile razy wykryto ka�d� cech� dla ka�dej innej litery w zestawie szkoleniowym. Te dane statystyczne wykorzystano do oszacowania prawdopodobie�stwa wykrycia danej cechy dla ka�dej litery. Te oszacowania prawdopodobie�stwa wykorzystano nast�pnie do wa�enia cech sumowanych przez rozpoznaj�ce demony. Po szkoleniu system zosta� przetestowany na pr�bkach r�cznie drukowanych znak�w, kt�rych jeszcze nie widzia�. Wed�ug Selfridge′a i Neissera: "Ten program sprawia, �e tylko oko�o 10 procent mniej jest poprawnych identyfikacji, ni� czytelnicy ludzcy robi� {na pewno przyzwoit� wydajno��."

Sieci neuronowe

Perceptrony

W 1957 r. Frank Rosenblatt (1928-1969, psycholog z Cornell Aeronautical Laboratory w Buffalo w stanie Nowy Jork) rozpocz�� prac� nad sieciami neuronowymi w ramach projektu o nazwie PARA (Perceiving and Recognizing Automaton). Motywowa� go wcze�niejsza praca McCullocha. Pitts i Hebb zainteresowali si� tymi sieciami, kt�re nazwa� perceptronami, jako potencjalnymi modelami ludzkiego uczenia si�, poznania i pami�ci. Kontynuuj�c na pocz�tku lat 60. jako profesor na Cornell University w Ithaca w Nowym Jorku, eksperymentowa� z wieloma r�nych rodzaj�w perceptron�w. Jego praca, bardziej ni� Clarka i Farleya oraz innych pionier�w sieci neuronowych, by�a odpowiedzialna za zainicjowanie jednej z g��wnych alternatyw dla metod przetwarzania symboli w AI, a mianowicie sieci neuronowych. Perceptrony Rosenblatta sk�ada�y si� z McCulloch {Elementy neuronowe w stylu Pittsa, takie jak ten pokazany poni�ej

Ka�dy element mia� dane wej�ciowe (przychodz�ce od lewej strony w g�r�), \ wagi "(pokazane przez wybrzuszenia na liniach wej�ciowych) i jedno wyj�cie (wychodz�ce w prawo). Dane wej�ciowe mia�y warto�ci 1 lub 0, i ka�de wej�cie zosta�o pomno�one przez zwi�zan� z nim warto�� wagi. Element neuronowy obliczy� sum� tych wa�onych warto�ci. Na przyk�ad, je�li wszystkie dane wej�ciowe do elementu neuronowego na rysunku by�y r�wne 1, suma wynosi�aby 13. Gdyby suma by�a wi�ksza ni� (lub po prostu r�wna) "warto�� progowa", powiedzmy 7, powi�zana z elementem, w�wczas dane wyj�ciowe elementem neuronowym b�dzie 1, co by�oby w tym przyk�adzie. W przeciwnym razie wynik wyni�s�by 0. Perceptron sk�ada si� z sieci tych element�w neuronowych, w kt�rych wyj�cia jednego elementu s� danymi wej�ciowymi dla innych. (Jest tu analogia do Pandemonium Selfridge'a, w kt�rym demony �redniego poziomu otrzymuj� "krzyki" demony ni�szego poziomu. Ci�ary na liniach wej�ciowych elementu neuronowego mo�na traktowa� jako analogiczne do "kontroli si�y" zwi�kszaj�cej lub zmniejszaj�cej si�� w Pandemonium.) Przyk�adowy perceptron pokazano poni�ej.

[Rosenblatt narysowa� schematy perceptron�w w formacie poziomym (styl elektrotechniczny), z wej�ciami po lewej i wyj�ciami po prawej. Tutaj u�ywam stylu pionowego og�lnie preferowanego przez informatyk�w do hierarchii, z najni�szym poziomem u do�u i najwy�szym u g�ry. Aby upro�ci� schemat, wybrzuszenia wagi nie s� pokazane.] Chocia� przedstawiony perceptron, z tylko jedn� jednostk� wyj�ciow�, jest zdolny tylko do dw�ch r�nych wyj�� (1 lub 0), wiele wyj�� (zestawy 1 i 0) mo�na uzyska� przez u�o�enie dla kilku jednostek wyj�ciowych. Warstwa wej�ciowa, pokazana na dole rysunku, by�a zazwyczaj prostok�tnym uk�adem 1 i 0 odpowiadaj�cych kom�rkom zwanym "pikselami" czarno-bia�ego obrazu. Jedn� z aplikacji, kt�rymi interesowa�a si� Rosenblatt, by�o, podobnie jak Selfridge, rozpoznawanie znak�w. U�yj� prostej algebry i geometrii, aby pokaza�, jak elementy neuronowe w sieciach perceptronowych mo�na "szkoli�" w celu uzyskania po��danych wynik�w. Rozwa�my na przyk�ad pojedynczy element neuronowy, kt�rego danymi wej�ciowymi s� warto�ci x₁, x₂ i x₃ i kt�rych powi�zanymi warto�ciami wagowymi s� w₁, w₂ i w₃. Gdy suma obliczona przez ten element jest dok�adnie r�wna jego warto�ci progowej, powiedzmy t, mamy r�wnanie w₁x₁ + w₂x₂ + w₃x₃ = t: W algebrze takie r�wnanie nazywa si� r�wnaniem "liniowym. "Okre�la granic� liniow�, czyli p�aszczyzn�, w przestrzeni tr�jwymiarowej. P�aszczyzna oddziela te warto�ci wej�ciowe, kt�re spowodowa�yby, �e element neuronowy mia�by wynik 1 z tych, kt�re spowodowa�yby, �e mia�by wynik 0. Pokazuj� typow� p�ask� granic� na rysunku

Wej�cie do elementu neuronowego mo�e by� przedstawione jako punkt (to znaczy wektor) w tej tr�jwymiarowej przestrzeni. Jego wsp�rz�dne to warto�ci x ₁, x ₂ i x ₃, z kt�rych ka�da mo�e wynosi� 1 lub 0. Gure pokazuje sze�� takich punkt�w, trzy z nich (powiedzmy ma�e k�ka) powoduj�ce, �e element ma moc wyj�ciow� 1, a trzy (powiedzmy ma�e kwadraty) powoduj�ce, �e ma moc wyj�ciow� 0. Zmiana warto�ci progu powoduje, �e p�aszczyzna porusza� si� na boki w kierunku r�wnoleg�ym do siebie. Zmiana warto�ci ci�ar�w powoduje obr�t p�aszczyzny. Tak wi�c, zmieniaj�c warto�ci ci�aru, punkty, kt�re kiedy� znajdowa�y si� po jednej stronie p�aszczyzny, mog�y sko�czy� si� po drugiej stronie. "Szkolenie" odbywa si� poprzez wykonanie takich zmian. B�d� mia� wi�cej do powiedzenia na temat procedur szkoleniowych. W wymiarach wi�kszych ni� trzy (co zwykle ma miejsce), liniowa granica nazywana jest "hiperp�aszczyzn�". Chocia� nie jest mo�liwe zwizualizowanie tego, co dzieje si� w przestrzeniach o du�ych wymiarach, matematycy wci�� m�wi� o punktach wej�ciowych w tych przestrzeniach oraz obrotach i ruchach hiperp�aszczyzn w odpowiedzi na zmiany warto�ci wag i prog�w. Rosenblatt zdefiniowa� kilka rodzaj�w perceptron�w. Nazwa� ten pokazany na schemacie "czteropow�okowym perceptronem sprz�onym szeregowo". (Rosenblatt liczy� dane wej�ciowe jako pierwsz� warstw�.) Nazywano to "sprz�eniem szeregowym", poniewa� moc wyj�ciowa ka�dego elementu neuronowego przekazywana by�a do element�w neuronowych w kolejnej warstwie. W najnowszej terminologii zamiast wyra�enia "sprz�ony szeregowo" u�yto wyra�enia "informacje zwrotne". Natomiast perceptron "sprz�ony krzy�owo" mo�e mie� wyj�cia element�w neuronowych w jednej warstwie jako dane wej�ciowe do element�w neuronalnych w tej samej warstwie. Perceptron sprz�ony "krzy�owo" mo�e mie� dane wyj�ciowe element�w neuronowych w jednej warstwie elementy neuronowe w warstwach o ni�szych numerach. Rosenblatt pomy�la� o swoich perceptronach jako o modelach okablowania cz�ci m�zgu. Z tego powodu nazwa� elementy neuronowe we wszystkich warstwach, ale w warstwie wyj�ciowej, "jednostkami asocjacji" (A-units), poniewa� zamierza� je modelowa� asocjacje wykonywane przez sieci neuron�w w m�zgu. Szczeg�lnie interesuj�ce by�y badania Rosenblatta to, co nazwa� "perceptronem alfa". Sk�ada�o si� z tr�jwarstwowej sieci sprz�enia zwrotnego z warstw� wej�ciow�, warstw� asocjacyjn� i jedn� lub wi�cej jednostkami wyj�ciowymi. W wi�kszo�ci jego eksperyment�w dane wej�ciowe mia�y warto�ci 0 lub 1, odpowiadaj�ce czarnym lub bia�ym pikselom na obrazie wizualnym przedstawionym na tak zwanej "siatk�wce". Ka�da jednostka A otrzyma�a dane wej�ciowe (kt�re nie zosta�y pomno�one przez warto�ci masy) z jakiego� losowo wybranego podzbioru pikseli i wys�a�a sw�j wynik , poprzez zestawy regulowanych wag, do ko�cowych jednostek wyj�ciowych, kt�rych warto�ci binarne mo�na interpretowa� jako kod dla kategorii obrazu wej�ciowego. Pr�bowano zastosowa� r�ne "procedury szkoleniowe" w celu dostosowania wag jednostek wyj�ciowych perceptronu alfa , W najbardziej dla tych (dla cel�w rozpoznawania wzorc�w) wagi prowadz�ce do jednostek wyj�ciowych wynosi�y korygowane tylko wtedy, gdy jednostki te pope�ni�y b��d w klasyfikacji danych wej�ciowych. Korekty by�y takie, aby wymusi� na wyj�ciu prawid�ow� klasyfikacj� dla tego konkretnego wej�cia. Ta technika, kt�ra wkr�tce sta�a si� standardem, zosta�a nazwana "procedur� korekcji b��d�w". Rosenblatt z powodzeniem wykorzysta� j� w szeregu eksperyment�w do szkolenia perceptron�w do klasyfikowania sygna��w wizualnych, takich jak znaki alfanumeryczne lub sygna��w akustycznych, takich jak d�wi�ki mowy. Profesor H. David Block, matematyk Cornell wsp�pracuj�cy z Rosenblattem, by� w stanie udowodni�, �e procedura korekcji b��d�w gwarantuje znalezienie hiperp�aszczyzny, kt�ra doskonale oddzieli zestaw danych treningowych, gdy taka hiperp�aszczyzna istnia�a. wykonane za pomoc� symulacji komputerowych, Rosenblatt wola� budowa� wersje sprz�towe swoich perceptron�w (symulacje by�y wczesne na wczesnych komputerach, co wyja�nia�o zainteresowanie budowaniem specjalnego sprz�tu perceptronowego). MARK I by� alfa-perceptronem zbudowanym w Cornell Aeronautical Laboratory pod sponsorowanie Oddzia�u System�w Informatycznych Offce of Naval Research i Rome Air Development Center. Zosta�o to publicznie zademonstrowane 23 czerwca 1960 r. MARK I u�ywa� regulator�w g�o�no�ci (zwanych przez in�ynier�w elektryk�w "potencjometrami") do wa�enia. Maj� one przymocowane do nich ma�e silniki w celu wykonania regulacji w celu zwi�kszenia lub zmniejszenia warto�ci masy. W 1959 roku Frank Rosenblatt przeni�s� swoj� prac� perceptronow� z Cornell Aeronautical Laboratory w Buffalo w stanie Nowy Jork na Cornell University, gdzie zosta� profesorem psychologii. Wraz z Blockiem i kilkoma studentami Rosenblatt kontynuowa� eksperymentalne i teoretyczne prace nad perceptronami. Jego ksi��ka Principles of Neurodynamics szczeg�owo opisuje jego teoretyczne pomys�y i wyniki eksperyment�w. Ostatni system Rosenblatta, zwany Tobermory, zosta� zbudowany jako urz�dzenie do rozpoznawania mowy. [Tobermory to imi� kota, kt�ry nauczy� si� m�wi� w The Chronicles of Clovis, grupie opowiada� Saki (H. H. Munro).] Kilka doktorant�w studenci, w tym George Nagy, Carl Kessler, R. D. Joseph i inni, uko�czyli projekty perceptronowe pod Rosenblattem w Cornell. W ostatnich latach pobytu w Cornell Rosenblatt zaj�� si� badaniem transferu pami�ci chemicznej u robak�w i innych zwierz�t {temat ca�kowicie usuni�ty z pracy nad perceptronem. Niestety, Rosenblatt zgin�� w wypadku podczas �eglugi w zatoce Chesapeake w 1969 roku. Mniej wi�cej w tym samym czasie co alfa-perceptron Rosenblatta, Woodrow W. (Woody) Bledsoe (1921 {1995) i Iben Browning (1918-1991), dwaj matematycy z Sandia Laboratories w Albuquerque w Nowym Meksyku, r�wnie� prowadzili badania nad rozpoznawaniem znak�w, kt�re wykorzystywa�y losowe pr�bki obraz�w wej�ciowych. Eksperymentowali z systemem, kt�ry wy�wietla� obrazy znak�w alfanumerycznych na mozaice 10 x 15 fotokom�rek i pr�bkowa� stany 75 losowo wybranych par fotokom�rek. Wskazuj�c, �e pomys� mo�na rozszerzy� na pr�bkowanie wi�kszych grup pikseli, powiedzmy N z nich, nazwali swoj� metod� metod� "N-krotki". Wykorzystali wyniki tego pr�bkowania do podj�cia decyzji o kategorii litery wej�ciowej

ADALINESY I MADALINES

Niezale�nie od Rosenblatt, grupa kierowana przez profesora in�ynierii elektrycznej Stanforda Bernarda Widrowa r�wnie� pracowa�a nad systemy sieci neuronowych na prze�omie lat 50. i 60. XX wieku. Widrow niedawno do��czy� do Stanford po uko�czeniu doktoratu z teorii sterowania na MIT. Chcia� wykorzysta� systemy sieci neuronowej do czego�, co nazwa� "kontrol� adaptacyjn�". Jedno z urz�dze� zbudowanych przez Widrow nazwano "ADALINE "(dla adaptacyjnej sieci liniowej). By� to pojedynczy element neuronowy, kt�rego regulowane ci�ary by�y realizowane przez prze��czalne (w ten spos�b regulowane) obwody rezystor�w. Widow i jeden z jego uczni�w, Marcian E. "Ted" Hoff Jr. (kt�ry p�niej wynalaz� pierwszy mikroprocesor w firmie Intel), opracowali regulowan� wag�, kt�r� nazywali "a" "memistor". Sk�ada� si� z grafitowego pr�ta, na kt�rym warstwa miedzi mog�a by� powlekana i nieplaterowana - zmieniaj�c w ten spos�b jej op�r elektryczny. Widrow i Hoff opracowali procedur� szkolenia dla ich elementu neuronowego ADALINE, kt�ry nazwano algorytmem adaptacyjnym najmniejszych �rednich kwadrat�w Widrowa-Hoffa. Wi�kszo�� eksperymentalnych prac Widrowa zosta�a wykonana przy u�yciu symulacji na komputerze IBM1620. Ich najbardziej skomplikowany projekt sieci nazwano "MADALINE" (dla wielu ADALINE). Procedur� szkoleniow� opracowa� dla niego w Stanford student William Ridgway.

Systemy MINOS w SRI

Sukces Rosenblatta z perceptronami w problemach z rozpoznawaniem wzorc�w doprowadzi� do wzmo�enia wysi�k�w badawczych innych os�b w celu powielenia i rozszerzenia jego wynik�w. W latach sze��dziesi�tych by� mo�e najbardziej znacz�ce prace w zakresie rozpoznawania wzorc�w z wykorzystaniem sieci neuronowych zosta�y wykonane w Stanford Research Institute w Menlo Park w Kalifornii. Tam Charles A. Rosen (1917-2002) kierowa� laboratorium, kt�re pr�bowa�o wytrawi� mikroskopijne lampy pr�niowe na pod�o�u p�przewodnikowym. Rosen spekulowa�, �e obwody zawieraj�ce te lampy mog� by� ostatecznie "pod��czone" do wykonywania przydatnych zada� przy u�yciu niekt�rych procedur szkoleniowych opisanych przez Franka Rosenblatta. SRI zatrudni�o Rosenblatta jako konsultanta do pomocy w projektowaniu eksploracyjnej sieci neuronowej. Kiedy w 1960 roku przeprowadzi�em wywiad na stanowisko w SRI, zesp� w laboratorium Rosen pod kierownictwem Alfreda E. (Teda) Brain (1923-2004) w�a�nie zako�czy� budow� ma�ej sieci neuronowej o nazwie MINOS. (W mitologii greckiej Minos by� kr�lem Krety i synem Zeusa i Europy. Po �mierci Minos by� jednym z trzech s�dzi�w w podziemiu). Brain uwa�a�, �e symulacje komputerowe sieci neuronowych s� zbyt wolne do praktycznych zastosowa�, co prowadzi do decyzji o budowie zamiast programowania. (Komputer IBM 1620 u�ywany w tym samym czasie przez grup� Widrowa w Stanford do symulacji sieci neuronowych mia� podstawowy cykl maszynowy wynosz�cy 21 mikrosekund i maksymalnie 60 000 "cyfr "pami�ci o swobodnym dost�pie.) W celu regulacji ci�ar�w MINOS zastosowa� magnetyczny urz�dzenia zaprojektowane przez Brain. Rosenblatt pozostawa� w bliskim kontakcie z SRI, poniewa� by� zainteresowany wykorzystaniem tych urz�dze� magnetycznych jako zamiennik�w swoich potencjometr�w nap�dzanych silnikiem. Entuzjazm i optymizm Rosen odno�nie potencja�u sieci neuronowych pom�g� mu do��czy� do SRI. Po moim przybyciu w lipcu 1961 r. dosta� szkic ksi��ki Rosenblatta do przeczytania. Zesp� Brain dopiero zaczyna� prace nad budow� du�ej sieci neuronowej, zwanej MINOS II, kontynuacj� mniejszego systemu MINOS. wspierany przede wszystkim przez Korpus Sygna�owy Armii USA w latach 1958-1967. Celem pracy MINOS by�o "przeprowadzenie bada� naukowych i eksperymentalnych bada� technik i sprz�tu cechy odpowiednie do praktycznego zastosowania w graficznym przetwarzaniu danych dla potrzeb wojskowych. "G��wnym celem projektu by�o automatyczne rozpoznawanie symboli na mapach wojskowych. Podj�to r�wnie� pr�by innych zastosowa� - takich jak rozpoznawanie pojazd�w wojskowych, takich jak czo�gi, na zdj�ciach lotniczych i rozpoznawanie r�cznie drukowanych znak�w - w pierwszym etapie przetwarzania przez MINOS II obraz wej�ciowy by� replikowany 100 razy za pomoc� matrycy plastikowej 10 x 10. Ka�dy z tych identycznych obraz�w zosta� nast�pnie przes�any przez w�asn� optyczn� mask� wykrywaj�c� cechy, a �wiat�o przez mask� zosta�o wykryte przez fotokom�rk� i por�wnane z progiem. Rezultatem by� zestaw 100 warto�ci binarnych (wy��czone - w��czone). Warto�ci te stanowi�y dane wej�ciowe do zestawu 63 element�w neuronowych ("jednostek A" w terminologii Rosenblatta), ka�dy o 100 zmiennych wagach magnetycznych. 63 wyj�cia binarne z tych element�w neuronowych zosta�y nast�pnie przet�umaczone na jedn� z 64 decyzji dotycz�cych kategorii oryginalnego obrazu wej�ciowego. (Zbudowali�my 64 r�wnie odleg�e "punkty" w sze��dziesi�ciu tr�jwymiarowych przestrzeniach i przeszkolili�my sie� neuronowa, dzi�ki czemu ka�dy obraz wej�ciowy tworzy punkt bli�szy w�asnemu punktowi prototypu ni� innemu. Ka�dy z tych prototypowych punkt�w by� jedn� z 64 "sekwencji rejestru przesuwnego o maksymalnej d�ugo�ci" o 63 wymiarach). W latach 60. grupa sieci neuronowych SRI, zwana w�wczas � Grupa Learning Machines bada�a wiele r�nych organizacji sieciowych i procedur szkoleniowych. Poniewa� komputery sta�y si� zar�wno bardziej dost�pne, jak i pot�niejsze, coraz cz�ciej korzystali�my z symulacji (w r�nych centrach komputerowych) na komputerach Burroughs 220 i 5000 oraz na IBM 709 i 7090. W po�owie lat 60. otrzymali�my w�asny edytowany komputer, SDS 910 (SDS 910, opracowany w Scienti c Data Systems, by� pierwszym komputerem, w kt�rym zastosowano tranzystory krzemowe). U�yli�my tego komputera w po��czeniu z najnowsz� wersj� naszego sprz�tu sieci neuronowej (teraz z wykorzystaniem zestawu 1024 soczewek wst�pnego przetwarzania), po��czenie nazwali�my MINOS III. Jednym z najbardziej udanych rezultat�w w systemie MINOS III by�o automatyczne rozpoznawanie r�cznie drukowanych znak�w na arkuszach koduj�cych FORTRAN. (W latach 60. programy komputerowe by�y zwykle pisane r�cznie, a nast�pnie konwertowane na karty dziurkowane przez operator�w uderze� kluczowych). Pracami tymi kierowali John Munson (1939�1972), Peter Hart i Richard Duda. Neuronowa cz�� MINOS III zosta�a wykorzystana do stworzenia rankingu mo�liwych klasyfikacji dla ka�dej postaci z miar� si�y dla ka�dej postaci. Na przyk�ad, pierwszy znak napotkany w ci�gu znak�w mo�e zosta� rozpoznany przez sie� neuronow� jako �D� o sile 90 i jako �O� o sile 10. Ale akceptuj�c najbardziej pewn� decyzj� dla ka�dego znaku nie mo�e powsta� ci�g znak�w, kt�ry jest prawnym o�wiadczeniem w j�zyku FORTRAN {wskazuj�c, �e co najmniej jedna decyzja by�a b��dna (przy za�o�eniu, �e ktokolwiek napisa� o�wiadczenie na arkuszu kodowym napisa� o�wiadczenie prawne). Zaakceptowanie drugiego lub trzeciego najbardziej bezpiecznego wyboru dla niekt�rych znak�w mo�e by� wymagane do utworzenia prawid�owego ci�gu znak�w. Ca�kowit� st�Senie pe�nego ci�gu znak�w obliczono, dodaj�c stany poszczeg�lnych znak�w w ci�gu. Nast�pnie potrzebny by� spos�b uszeregowania tych liczb liczb ca�kowitych dla ka�dego z mo�liwych ci�g�w wynikaj�cych ze wszystkich r�nych wybor�w dla ka�dego znaku. Spo�r�d tego rankingu wszystkich mo�liwych ci�g�w system nast�pnie wybra� najbardziej pewny ci�g prawny. Jednak, jak napisa� Richard Duda, �Problem znalezienia pierwszego, drugiego, trzeciego� najbardziej z�o�onego ci�gu znak�w nie jest wcale trywialnym problemem�. Kluczem do skutecznego obliczenia rankingu by�o zastosowanie metody zwanej programowaniem dynamicznym. Ilustracja pr�bki oryginalnego �r�d�a i ostatecznego wyj�cia pokazano poni�ej.

Po przeszkoleniu cz�ci sieci neuronowej systemu, ca�y system (kt�ry zdecydowa� si� na najbardziej pewny ci�g prawny) by� w stanie osi�gn�� dok�adno�� rozpoznawania wynosz�c� nieco ponad 98% na du�ej pr�bce materia�u, kt�ry nie by� cz�ci� tego, na co szkolono system. Rozpoznawanie odr�cznych postaci z takim poziomem dok�adno�ci by�o znacz�cym osi�gni�ciem w latach sze��dziesi�tych. Rozszerzaj�c swoje zainteresowania poza sieci neuronowe, Learning Machines Group ostatecznie przekszta�ci�o si� w Centrum Sztucznej Inteligencji SRI, kt�re do dzi� jest wiod�cym przedsi�biorstwem badawczym zajmuj�cym si� AI.

Metody statystyczne

W latach pi��dziesi�tych i sze��dziesi�tych istnia�o kilka zastosowa� metod statystycznych do problem�w z rozpoznawaniem wzorc�w. Wiele z tych metod by�o bardzo podobnych do niekt�rych technik sieci neuronowych. Przypomnij sobie, �e wcze�niej wyja�ni�em, jak zdecydowa�, kt�ry z dw�ch ton�w b�dzie obecny w g�o�nym sygnale radiowym. Podobn� technik� mo�na zastosowa� do rozpoznawania wzor�w. Do klasyfikowania obraz�w (lub innych danych percepcyjnych) zwykle reprezentowano dane wej�ciowe za pomoc� listy wyr�niaj�cych "cech", takich jak te u�ywane przez Selfridge'′a i jego wsp�pracownik�w. Na przyk�ad w rozpoznawaniu znak�w alfanumerycznych jedn� z pierwszych cech wyodr�bniono z obrazu znaku, kt�ry ma zosta� sklasyfikowany. Zazwyczaj cechy mia�y warto�ci liczbowe, takie jak liczba razy, gdy linie o r�nych k�tach przecina�y znak lub d�ugo�� obwodu najmniejszego ko�a, kt�re ca�kowicie otacza�o znak. Wyb�r odpowiednich funkcji by� cz�sto bardziej sztuk� ni� nauk�, ale mia� kluczowe znaczenie dla dobrej wydajno�ci. Potrzebujemy troch� elementarnej notacji matematycznej, aby pom�c opisa� te statystycznie zorientowane metody rozpoznawania wzorc�w. Za��my, �e lista funkcji wyodr�bnionych ze znaku to {f₁; f₂; … ; f_i;… :; f_N}. Skr�c� t� list� za pomoc� pogrubionego symbolu X. Za��my, �e istnieje k kategorii, C₁; C₂;… ; C_i; … ; C_k, do kt�rego mo�e nale�e� znak opisany przez XU�ywaj�c regu�y Bayesa w spos�b podobny do opisanego wcze�niej, regu�a decyzyjna jest nast�puj�ca: Zdecyduj na korzy�� tej kategorii, dla kt�rej p(X |C_i)p(C_i) jest najwi�ksze, gdzie p(C_i jest prawdopodobie�stwem a priori kategorii C_i i p(p(C_ii) to prawdopodobie�stwo X dla C_i. Prawdopodobie�stwa te mo�na wywnioskowa�, zbieraj�c dane statystyczne z du�ej pr�bki znak�w. Jak wspomnia�em wcze�niej, badacze w rozpoznawaniu wzor�w cz�sto opisuj� proces decyzyjny w kategoriach geometrii. Wyobra�aj� sobie, �e warto�ci cech uzyskanych z pr�bki obrazu mo�na przedstawi� jako punkt w przestrzeni wielowymiarowej. Je�li mamy kilka pr�bek dla ka�dej powiedzmy dw�ch znanych kategorii danych, mo�emy reprezentowa� te pr�bki jako rozproszenie punkt�w w przestrzeni. W rozpoznawaniu znak�w rozproszenie mo�e wyst�pi� nie tylko dlatego, �e obraz postaci mo�e by� ha�a�liwy, ale tak�e dlatego, �e postacie z tej samej kategorii mog� by� rysowane nieco inaczej. Pokazuj� dwuwymiarowy przyk�ad z funkcjami f₁ i f₂ na rysunku.

Na podstawie rozproszenia punkt�w w ka�dej kategorii mo�emy obliczy� oszacowanie prawdopodobie�stw potrzebnych do obliczenia prawdopodobie�stw. Nast�pnie mo�emy wykorzysta� prawdopodobie�stwa i wcze�niejsze prawdopodobie�stwa do podj�cia decyzji. Pokazuj� tutaj granic�, obliczon� na podstawie prawdopodobie�stw i wcze�niejszych prawdopodobie�stw, kt�ra dzieli przestrze� na dwa regiony. W jednym regionie decydujemy si� na kategori� 1; z drugiej wybieramy kategori� 2. Pokazuj� tak�e nowy punkt funkcji, X, kt�ry ma zosta� sklasyfikowany. W tym przypadku pozycja X wzgl�dem granicy narzuca, �e klasyfikujemy X jako cz�onka kategorii 1. Istniej� r�wnie� inne metody klasyfikacji punkt�w charakterystycznych. Ciekawym przyk�adem jest metoda \ najbli�szego s�siada. W tym schemacie, wynalezionym przez E. Fixa i JL Hodgesa w 1951,nowy punkt cechy jest przypisany do tej samej kategorii, co ten przyk�adowy punkt cechy, do kt�rego jest najbli�ej. na powy�szym rysunku nowy punkt X zosta�by sklasyfikowany jako nale��cy do kategorii 2. przy u�yciu metody najbli�szego s�siada. Wa�ne opracowanie metody najbli�szego s�siada przypisuje nowy punkt do tej samej kategorii co wi�kszo�� k najbli�szych punkt�w. regu�a decyzyjna wydaje si� prawdopodobna (w przypadku, gdy istnieje wiele, wiele punkt�w pr�bnych ka�dej kategorii), poniewa� istnieje wi�cej punkt�w pr�bnych kategorii C_i bli�ej nieznanego punktu, X, ni� punkty pr�bne kategorii C_j jest dowodem, �e p(X | Ci) p (C_i) jest wi�kszy ni� p(X | C_j)) p (C_j) W oparciu o t� og�ln� obserwacj� Thomas Cover i Peter Hart rygorystycznie przeanalizowali skuteczno�� metod najbli�szego s�siedztwa. Ka�da technika rozpoznawania wzorc�w, nawet wykorzystuj�ca sieci neuronowe lub najbli�szych s�siad�w, mo�e by� uwa�ana za konstruowanie granic oddzielaj�cych w wielowymiarowej przestrzeni cech. Inn� metod� konstruowania granic przy u�yciu "funkcji potencjalnych" zasugerowali rosyjscy naukowcy M. A. Aizerman, E. M. Braverman i L. I. Rozonoer w latach 60. Niekt�re wa�ne wczesne ksi��ki na temat stosowania metod statystycznych w rozpoznawaniu wzorc�w to George Sebestyen, Richard Duda i Peter Hart. Technologia rozpoznawania wzor�w pod koniec lat 60. XX wieku zosta�a dobrze oceniona przez George'a Nagy'a (kt�ry wcze�niej by� jednym z doktorant�w Franka Rosenblatta).

Zastosowania rozpoznawania wzor�w w rozpoznaniu lotniczym Sie� neuronowa i metody statystyczne rozpoznawania wzorc�w przyci�gn�y wiele uwagi w wielu firmach z bran�y lotniczej i lotniczej na prze�omie lat 50. i 60. XX wieku. Firmy te mia�y du�y bud�et na badania i rozw�j wynikaj�ce z um�w z Departamentem Obrony USA. Wiele z nich by�o szczeg�lnie zainteresowanych problemem zwiadu powietrznego, tj. lokalizacj� i identyfikacj� "cel�w" na zdj�ciach lotniczych. W�r�d firm prowadz�cych szeroko zakrojone programy badawcze po�wi�cone temu zagadnieniu i powi�zanych z nimi problemami by� Dzia� Aeronutronic Ford Motor Co., Douglas Aircraft Company (jak wtedy by�o znane), General Dynamics, Lockheed Missiles and Space Division oraz Philco Corporation (Philco zosta� p�niej przej�ty przez Forda pod koniec 1961 r.) Wspomn� o niekt�rych pracach w Philco , Laveen N. Kanal, Neil C. Randall i Thomas Harley pracowali zar�wno nad teori�, jak i metodami statystycznego rozpoznawania wzorc�w. Opracowane przez nich systemy s�u�y�y do przegl�dania zdj�� lotniczych pod k�tem interesuj�cych cel�w wojskowych, takich jak czo�gi. ilustracja jednego z ich system�w pokazano na rysunku

Aparat Philco zeskanowa� materia� z 9-calowych negatyw�w zebranych przez samolot rozpoznawczy U2 podczas manewr�w czo�g�w armii ameryka�skiej w Fort Drum w Nowym Jorku. Niewielka cz�� zeskanowanego zdj�cia, prawdopodobnie zawieraj�ca czo�g M-48 (w standardowej pozycji i rozmiarze), zosta�a najpierw przetworzona w celu wzmocnienia kraw�dzi, a wynik zosta� przedstawiony systemowi wykrywania celu jako uk�ad zer i jedynek. Pierwszy z ich system�w u�ywa� tablicy 22 x 12; p�niej u�ywali tablicy 32 x 32, jak pokazano na powy�szym rysunku. Tablica zosta�a nast�pnie podzielona na 24 nak�adaj�ce si� 8 x 8 "blok�w cech". Dane w ka�dym bloku obiekt�w s� nast�pnie poddawane testowi statystycznemu, aby zdecydowa�, czy ma�y obszar obrazu reprezentowany przez ten blok zawiera cz�� zbiornika. Testy statystyczne oparto na "pr�bce szkoleniowej" 50 obraz�w zawieraj�cych zbiorniki i 50 pr�bek terenu niezawieraj�cego zbiornik�w. Dla ka�dego bloku cech 8 x 8 opracowano parametry statystyczne z tych pr�bek w celu ustalenia (liniowej) granicy w sze��dziesi�ciu - czterowymiarowa przestrze�, kt�ra najlepiej rozr�nia pr�bki zbiornik�w od pr�bek nieczo�gowych. Korzystaj�c z tych granic, system zosta� nast�pnie przetestowany na innym zestawie 50 obraz�w zawieraj�cych zbiorniki i 50 obraz�w niezawieraj�cych zbiornik�w. Dla ka�dego obrazu testowego liczba cech bloki decyduj�ce o "obecno�ci czo�gu" zosta�y obliczone, aby uzyska� ko�cowy "wynik" liczbowy (np. 21 z 24 blok�w zdecydowa�o, �e czo�g by� obecny). Wynik ten mo�e by� nast�pnie wykorzystany do podj�cia decyzji, czy obraz zawiera czo�g. Autorzy stwierdzili, �e "wyniki eksperymentalne procedury klasyfikacji statystycznej przekroczy�y wszelkie oczekiwania". Prawie po�owa pr�bek testowych mia�a doskona�e wyniki (to znaczy, wszystkie 24 bloki cech prawid�owo rozr�nia�y zbiornik i zbiornik). Ponadto wszystkie pr�bki testowe zawieraj�ce zbiorniki mia�y wynik wi�kszy lub r�wny 11, a wszystkie pr�bki testowe niezawieraj�ce zbiornik�w mia�y wynik mniejszy lub r�wny 7. System wczesnego wykrywania zbiornik�w w Philco zosta� zbudowany z analogowym zesp� obwod�w - nie zaprogramowany na komputerze. Jak p�niej opracowa� Thomas Harley, lider projektu tego systemu, wa�ne jest, aby pami�ta� o technologicznym kontek�cie epoki, w kt�rej ta praca zosta�a wykonana. Wdro�ony przez nas system nie mia� wbudowanych mo�liwo�ci obliczeniowych. Ci�arami liniowej funkcji dyskryminacyjnej by�y rezystory, kt�re kontrolowa�y pr�d pochodz�cy z (binarnego) �r�d�a napi�cia w elementach rejestru przesuwnego. Pr�dy te zosta�y zsumowane i ka�da cecha zosta�a rozpoznana lub nie w zale�no�ci od tego, czy suma tych pr�d�w przekroczy�a warto�� progow�. Te decyzje dotycz�ce funkcji binarnych zosta�y nast�pnie zsumowane, ponownie w analogowym obwodzie elektrycznym, a nie w komputerze, i ponownie podj�to decyzj� [zbiornik lub brak zbiornika] w zale�no�ci od tego, czy suma przekroczy�a warto�� progow� W innym systemie klasyfikacja statystyczna zosta�a wdro�ona przez program o nazwie MULTINORM, dzia�aj�cy na komputerze Philco 2000. W innych eksperymentach Philco zastosowa� dodatkowe testy statystyczne, aby w wi�kszym stopniu obliczy� niekt�re bloki cech ni� inne przy obliczaniu wyniku ko�cowego. Kanal powiedzia�, �e te eksperymenty z wa�eniem wynik�w blok�w charakterystycznych "przewidywa�y ide� klasyfikacji maszyny wektor�w no�nych (SVM) [...] przy u�yciu pierwszej warstwy do identyfikacji pr�bek szkoleniowych blisko granicy mi�dzy zbiornikami i innych czo�gi." Oczywi�cie systemy te mia�y do�� atwe zadanie. Wszystkie czo�gi by�y w standardowej pozycji i by�y ju� odizolowane na zdj�ciu. (Autorzy wspominaj� jednak o tym, w jaki spos�b system mo�na dostosowa� do radzenia sobie z czo�gami wyst�puj�cymi w dowolnej pozycji lub orientacji na obrazie. System uwa�am za interesuj�cy nie tylko ze wzgl�du na jego wydajno��, ale tak�e poniewa� jest to system warstwowy (podobny do Pandemonium i do alfa-perceptronu) i poniewa� jest to przyk�ad, w kt�rym oryginalny obraz jest podzielony na nak�adaj�ce si� podobrazy, z kt�rych ka�dy jest przetwarzany niezale�nie. Jak wspomn� p�niej, nak�adaj�ce si� podobrazy odgrywaj� znacz�c� rol� w niekt�rych modelach obliczeniowych kory nowej. Niestety raporty Philco zawieraj�ce szczeg�y tej pracy nie s� �atwo dost�pne. Co wi�cej, Philco i niekt�re inne grupy zaanga�owane w t� prac� znikn�y. Oto, co napisa� mi Tom Harley o raportach Philco i o samym Philco: Wi�kszo�� prac zwi�zanych z rozpoznawaniem wzor�w wykonanych w Philco w latach 60. XX wieku by�a sponsorowana przez Departament Obrony, a raporty nie by�y dost�pne do publicznej dystrybucji. Od tego czasu sama firma naprawd� rozp�yn�a si� w powietrzu. Firma Phil Motor zosta�a kupiona przez Ford Motor Company w 1961 r., A do 1966 r. Wyeliminowali laboratoria badawcze Philco, w kt�rych pracowa� Laveen Kanal. Ford pr�bowa� przenie�� t� ma�� grup� do rozpoznawania wzor�w do Newport Beach w Kalifornii [lokalizacja firmy Aeronutronic Division, kt�rej grupa do rozpoznawania wzor�w r�wnie� si� p�niej z�o�y�a], a kiedy wszyscy postanowili nie i��, przenie�li ich do dzia�u komunikacji i powiedzieli aby zamkn�� nasze projekty rozpoznawania wzorc�w. Laveen ostatecznie przeszed� na University of Maryland. W p�niejszych latach to, co by�o Philco, zosta�o sprzedane Loralowi, a wi�kszo�� z nich zosta�a p�niej sprzedana Lockheedowi Martinowi. Podej�cie do problem�w AI zwi�zanych z sieciami neuronowymi i technikami statystycznymi nazwano "niesymbolicznymi" w celu zestawienia ich z prac� "przetwarzania symboli" przez osoby zainteresowane udowodnieniem twierdze�, graniem w gry i rozwi�zywaniem problem�w . Te niesymboliczne podej�cia znalaz�y zastosowanie g��wnie w rozpoznawaniu wzorc�w, przetwarzaniu mowy i widzeniekomputerowe. Warsztaty i konferencje po�wi�cone szczeg�lnie tym tematom zacz�y si� w latach 60. XX wieku. Podgrupa IEEE Computer Society (podkomitet ds. Rozpoznawania wzorc�w w komitecie ds. Pozyskiwania i przekszta�cania danych) zorganizowa�a pierwsze "rozpoznawanie wzorc�w" Warsztat ", kt�ry odby� si� w Puerto Rico w pa�dzierniku 1966 r. Drugi (w kt�rym uczestniczy�em) odby� si� w Delft w Holandii w sierpniu 1968 r. W 1966 r. Ta podgrupa sta�a si� IEEE Computer Society Pattern Analysis and Machine Intelligence (PAMI) ) Komitet techniczny, kt�ry nadal organizowa� konferencje i warsztaty. Tymczasem pod koniec lat 50. i na pocz�tku lat 60. ludzie przetwarzaj�cy symbole wykonywali swoj� prac� g��wnie na MIT, na Carnegie Mellon University, IBM i na Uniwersytecie Stanforda. przejd� dalej do opisu niekt�rych z tego, co zrobili.

Historia Sztucznej InteligencjiArtificial Intelligence Experts

Rozpoznawanie wzorc�w