Teoria logiki i wyszukiwania heurystyczne

Tu� przed warsztatami w Dartmouth Newell, Shaw i Simon mieli zaprogramowa� wersj� LT na komputerze w firmie RAND Corporation o nazwie JOHNNIAC (nazwany na cze�� Johna von Neumanna). P�niejsze artyku�y opisywa�y, w jaki spos�b udowodniono niekt�re twierdzenia w logice symbolicznej, kt�re zosta�y udowodnione przez Russella i Whitehead w tomie I ich klasycznej pracy, Principia Mathematica. LT pracowa� nad transformacjami pi�ciu aksjomat�w logiki zdaniowej Russella i Whiteheada, reprezentowanych dla komputera przez "struktury symboli", a� do wytworzenia struktury odpowiadaj�cej twierdzeniu, kt�re ma zosta� udowodnione. Poniewa� istnieje wiele r�nych transformacji, kt�re mo�na wykona�, znalezienie odpowiednich do udowodnienia danego twierdzenia wi��e si� z tym, co ludzie informatyki nazywaj� "procesem wyszukiwania". Aby opisa� dzia�anie LT i innych symbolicznych program�w AI, musz� najpierw wyja�ni�, co nale�y rozumie� przez "struktur� symboli", a co przez "ich przekszta�canie". W komputerze symbole mo�na ��czy� w listy, takie jak (A; 7; Q). Symbole i listy symboli to najprostsze rodzaje struktur symboli. Bardziej z�o�one struktury sk�adaj� si� z list symboli, takich jak ((B; 3); (A; 7; Q)), oraz list list list symboli i tak dalej. Poniewa� takie listy list itp. Mog� by� do�� z�o�one, nazywane s� "strukturami". Mo�na pisa� programy komputerowe, kt�re przekszta�caj� struktury symboli w inne struktury symboli. Na przyk�ad za pomoc� odpowiedniego programu struktura "(suma siedmiu i pi�ciu)" mo�e zosta� przekszta�cona w struktur� "(7 + 5)", kt�r� mo�na przekszta�ci� w symbol "12." Przekszta�canie struktur symboli i poszukiwanie odpowiedniej sekwencji rozwi�zywania problem�w le�y u podstaw pomys��w Newella i Simona dotycz�cych mechanizacji inteligencji. W p�niejszym artykule (tym, kt�ry dostali przy okazji otrzymania presti�owej nagrody Turinga), podsumowali proces w nast�puj�cy spos�b:

Rozwi�zania problem�w s� reprezentowane przez struktury symboli. Za fizyczny system symboli �wiczy inteligencj� w rozwi�zywaniu problem�w przez wyszukiwanie {to znaczy, generuj�c i stopniowo modyfikuj�c struktury symboli, a� wytworzy struktur� rozwi�zania.

…

Stwierdzenie problemu oznacza wyznaczenie (1) testu dla klasy struktur symboli (rozwi�zania problemu) i (2) generatora struktur symboli (potencjalne rozwi�zania). Aby rozwi�za� problem, nale�y wygenerowa� struktur� za pomoc� (2), kt�ra spe�nia test (1).

Zrozumienie szczeg�owo, w jaki spos�b sam LT u�y� struktur symboli i ich transformacji do udowodnienia twierdze�, wymaga�oby matematycznego i logicznego t�a. Proces ten jest �atwiejszy do wyja�nienia przy u�yciu jednego z ulubionych "problem�w z zabawkami" AI - "pi�tnastu zagadek". Pi�tna�cie �amig��wek jest jednym z kilku rodzaj�w �amig��wek. Problem polega na przekszta�ceniu tablicy p�ytek z pocz�tkowej konfiguracji w "cel" konfiguracji przez kolejne ruchy p�ytki do s�siedniej pustej kom�rki.

U�yj� prostszej wersji uk�adanki {takiej, kt�ra u�ywa tablicy 3 x 3 osiem przesuwanych p�ytek zamiast uk�adu 4 x 4. (Badacze AI eksperymentowali r�wnie� z programami do rozwi�zywania wi�kszych wersji uk�adanki, takimi jak 5 x 5 i 6 x 6.). Za��my, �e chcieli�my przenie�� p�ytki z ich konfiguracji po lewej stronie na te po prawej. Zgodnie z podej�ciem Newella i Simona musimy najpierw przedstawi� pozycje kafelk�w dla komputera za pomoc� struktur symboli, z kt�rymi komputer mo�e sobie poradzi�. B�d� reprezentowa� pozycj� pocz�tkow� wed�ug nast�puj�cej struktury, kt�ra jest list� trzech podlist:

((2; 8; 3); (1; 6; 4); (7; B; 5)):

Pierwsza lista podrz�dna, a mianowicie (2; 8; 3), wymienia osoby zajmuj�ce pierwszy rz�d tablicy uk�adanek i tak dalej. B oznacza pust� kom�rk� w �rodku trzeciego rz�du. W ten sam spos�b konfiguracja celu jest reprezentowana przez nast�puj�c� struktur�:

((1; 2; 3); (8; B; 4); (7; 6; 5)):

Nast�pnie musimy pokaza�, w jaki spos�b komputer mo�e przekszta�ca� struktury, kt�re skonfigurowali�my w spos�b, kt�ry odpowiada dozwolonym ruchom uk�adanki. Zauwa�, �e kiedy kafelek jest przenoszony, zamienia miejscami pust� kom�rk�; to znaczy, �e pusta kom�rka r�wnie� si� porusza. Pusta kom�rka mo�e si� porusza� w obr�bie wiersza lub zmienia� wiersze. Odpowiednio do tych ruch�w pustej kom�rki, gdy kafelek przesuwa si� w swoim rz�dzie, B zamienia miejsca z liczb� na lewo na li�cie (je�li jest) lub na prawo (je�li jest). Komputer mo�e �atwo wykona� dowoln� z tych transformacji. Gdy pusta kom�rka przesuwa si� w g�r� lub w d�, B zamienia miejsca z liczb� na odpowiedniej pozycji na li�cie po lewej stronie (je�li istnieje) lub na li�cie po prawej stronie (je�li istnieje). Przekszta�ce� tych mo�na r�wnie� dokona� do�� atwo za pomoc� programu komputerowego. Stosuj�c podej�cie Newella i Simona, zaczynamy od struktury symboli reprezentuj�cej pocz�tkow� konfiguracj� o�miu puzzli i stosujemy dozwolone transformacje, a� do osi�gni�cia celu. Istniej� trzy transformacje pocz�tkowej struktury symboli. Tworz� one nast�puj�ce struktury:

((2; 8; 3); (1; 6; 4); (B; 7; 5));

((2; 8; 3); (1; 6; 4); (7; 5; B));

i

((2; 8; 3); (1; B; 4); (7; 6; 5)):

�adne z nich nie reprezentuje konfiguracji celu, dlatego nadal stosujemy transformacje do ka�dego z nich i tak dalej, a� do osi�gni�cia struktury reprezentuj�cej cel. My (i komputer) mo�emy �ledzi� dokonane transformacje, ustawiaj�c je w strukturze przypominaj�cej treble, takiej jak pokazano w

(Groty strza�ek na obu ko�cach linii reprezentuj�cych transformacje wskazuj�, �e ka�da transformacja jest odwracalna)

Ta wersja �semki jest stosunkowo prosta, wi�c nie trzeba pr�bowa� wielu transformacji, zanim cel zostanie osi�gni�ty. Zazwyczaj jednak (szczeg�lnie w wi�kszych wersjach uk�adanki) komputer by�by zalany przez wszystkie mo�liwe transformacje {tak bardzo, �e nigdy nie generowa�by wyra�enia celu. Aby ograniczy� co�, co p�niej nazwano "eksplozj� kombinatoryczn�" transformacji, Newell i Simon zasugerowali u�ycie "heurystyki" do wygenerowania tylko tych transformacji, kt�re prawdopodobnie s� na drodze do rozwi�zania. W jednym ze swoich artyku��w na temat LT napisali: "proces, kt�ry mo�e rozwi�za� problem, ale nie daje �adnych gwarancji, nazywa si� to heurystyk� dla tego problemu". Zamiast �lepo uderza� we wszystkie strony w poszukiwaniu dowodu, LT u�y� wyszukiwania kierowanego heurystyk� lub \ heurystycznego wyszukiwania. "Zwykle, tak jak w przypadku LT, nie ma gwarancji, �e wyszukiwanie heurystyczne zako�czy si� powodzeniem, ale kiedy jest skuteczny (i to do�� cz�sto) eliminuje wiele innych bezowocnych poszukiwa� . Poszukiwanie rozwi�zania problemu z�o�onego z o�miu puzzli polega na powi�kszeniu drzewa struktur symboli poprzez zastosowanie transformacji do "li�ci" drzewa, a tym samym przed�u�enie Aby ograniczy� wzrost drzewa, powinni�my u�y� heurystyki, aby zastosowa� transformacje tylko do tych li�ci, kt�re s� na drodze do rozwi�zania. Jednym z takich heurystyk mo�e by� zastosowanie transformacji do tego li�cia z najmniejsz� liczb� p�ytek pozycji w por�wnaniu do konfiguracji bramkowej. Poniewa� problemy z przesuwanymi p�ytkami zosta�y dok�adnie zbadane, istnieje szereg heurystyk, kt�re okaza�y si� przydatne - te znacznie lepsze ni� prosta liczba p�ytek z pozycj� poza pozycj�, kt�r� w�a�nie zasugerowa�em. Wykorzystanie heurystyki kluczem do rozwi�zania problemu sta�o si� g��wnym tematem sztucznej inteligencji, co da�o pocz�tek tak zwanemu programowaniu heurystycznemu. "By� mo�e idea poszukiwania heurystycznego by�a ju� w powietrzu" w czasie warsztat�w w Dartmouth. By�o to dorozumiane we wcze�niejszej pracy Claude'a Shannona. W marcu 1950 r. Zapalony szachista Shannon opublikowa� artyku� proponuj�cy pomys�y na zaprogramowanie komputera do gry w szachy. W swoim artykule Shannon rozr�nia� strategie nazywane "typem A" i "typem B". Strategie typu A badaj� ka�d� mo�liw� kombinacj� ruch�w, podczas gdy strategie typu B wykorzystuj� specjalistyczn� wiedz� o szachach, aby skupi� si� na liniach gry, kt�re s� uwa�ane za najbardziej produktywne. Strategie typu B zale�a�y od tego, co Newell i Simon nazwali p�niej heurystyk�. A Minsky jest cytowany jako "�. Ju� uwa�a�em pomys� poszukiwa� heurystycznych za oczywisty i naturalny, tak wi�c teoretyk logiki nie by� dla mnie imponuj�cy". Do�� wcze�nie w AI stwierdzono, �e spos�b skonfigurowania problemu, jego "reprezentacja" ma kluczowe znaczenie dla jego rozwi�zania. Jednym z przyk�ad�w wp�ywu reprezentacji na rozwi�zywanie problem�w jest John McCarthy i nazywa si� to problemem "okaleczonej szachownicy". Oto problem: "Dwa szachownice po przeciwnych rogach s� usuwane z szachownicy. Czy to mo�liwe aby pokry� pozosta�e kwadraty domino? "(Domino to prostok�tna p�ytka, kt�ra pokrywa dwa s�siednie kwadraty.) Naiwnym sposobem poszukiwania rozwi�zania by�oby pr�ba umieszczenia domina na wszystkie mo�liwe sposoby nad szachownic�. Ale je�li kto� u�ywa informacja, �e szachownica sk�ada si� z 32 kwadrat�w jednego koloru i 32 innego koloru oraz, �e przeciwleg�e naro�ne kwadraty s� tego samego koloru, wtedy u�wiadomimy sobie, �e okaleczona deska sk�ada si� z 30 kwadrat�w jednego koloru i 32 drugiego. domino obejmuje dwa kwadraty przeciwnych kolor�w, nie ma sposobu, aby zestaw ich m�g� pokry� pozosta�e kolory. McCarthy by� zainteresowany tym, czy ludzie mog� wymy�li� "kreatywne" sposoby na u�o�enie uk�adanki, aby mo�na j� by�o rozwi�za� przez komputery wykorzystuj�ce metody oparte na logicznej dedukcji. Kolejn� klasyczn� �amig��wk�, kt�ra zosta�a wykorzystana do badania efekt�w r�nych reprezentacji, jest problem "misjonarzy i kanibali": Trzej kanibale i trzej misjonarze musz� przekroczy� rzek�. Ich ��d� mo�e pomie�ci� tylko dwie osoby. Je�li liczba kanibali przewy�szy liczb� misjonarzy, po obu stronach rzeki, misjonarze po tej stronie zgin�. Ka�dy misjonarz i ka�dy kanibal mo�e wios�owa� �odzi�. Jak ca�a sz�stka mo�e bezpiecznie przeprawi� przez rzek�? Wi�kszo�� ludzi nie ma problem�w z sformu�owaniem tej uk�adanki jako problemu wyszukiwania, a rozwi�zanie jest stosunkowo �atwe. Ale wymaga to jednego nieintuicyjnego kroku. Informatyk i badacz sztucznej inteligencji Saul Amarel (1928-2002) napisa� obszerny artyku� analizuj�cy t� �amig��wk� i r�ne jej rozszerzone wersje, w kt�rych mo�e by� r�na liczba misjonarzy i kanibali. (Wydaje si�, �e wersje rozszerzone nie s� takie proste.) Po przej�ciu z jednej reprezentacji do drugiej Amarel ostatecznie opracowa� reprezentacj� dla uog�lnionej wersji problemu, kt�rego rozwi�zanie praktycznie nie wymaga�o wyszukiwania. Naukowcy zajmuj�cy si� sztuczn� inteligencj� wci�� badaj�, jak najlepiej przedstawia� problemy, a co najwa�niejsze, w jaki spos�b zmusi� systemy AI do stworzenia w�asnych reprezentacji.

Udowadnianie twierdze� w geometrii

Nathan Rochester powr�ci� do IBM po warsztatach Dartmouth podekscytowanych dyskusjami, kt�re prowadzi� z Marvinem Minsky′m na temat pomys��w Minsky′ego na temat mo�liwego programu komputerowego do dowodzenia twierdze� w geometrii. Opisa� te pomys�y nowemu pracownikowi IBM, Herbowi Gelernterowi. Gelernter wkr�tce rozpocz�� projekt badawczy maj�cy na celu opracowanie maszyny do dowodzenia twierdze� geometrycznych. Przedstawi� artyku� na temat pierwszej wersji swojego programu na konferencji w Pary�u w czerwcu 1959,8, potwierdzaj�c, �e sam projekt badawczy jest konsekwencj� Letniego Projektu Badawczego Inteligencji Sztucznej Dartmouth z 1956 r., podczas kt�rego M. L. Minsky wskaza� potencjaln� u�yteczno�� schematu dla maszyny dowodz�cej twierdze� geometrycznych. Program Gelernter wykorzysta� dwa wa�ne pomys�y. Jednym z nich by�o jawne u�ycie subgoals (czasem nazywanych "rozumowaniem wstecznym lub "dziel i rz�d�"), a drugim by�o u�ycie diagramu do zamykania daremnych �cie�ek wyszukiwania.

trategia nauczana w szkole �redniej w celu udowodnienia twierdzenia z geometrii wi��e si� z ustaleniem dodatkowych fakt�w geometrycznych, z kt�rych, je�li to prawda, twierdzenie powsta�oby natychmiast. Na przyk�ad, aby udowodni�, �e dwa k�ty s� r�wne, wystarczy wykaza�, �e odpowiadaj� one k�tom dw�ch "przystaj�cych" tr�jk�t�w. (Tr�jk�t jest zgodny z innym, je�li mo�na go przet�umaczy� i obr�ci�, a nawet obr�ci�, w taki spos�b, aby dok�adnie pasowa� do drugiego.) Tak wi�c pierwotny problem przekszta�ca si� w problem pokazania, �e dwa tr�jk�ty s� przystaj�ce . Jednym ze sposob�w (mi�dzy innymi) pokazania, �e dwa tr�jk�ty s� zgodne, jest pokazanie, �e dwa odpowiadaj�ce boki i zamkni�ty k�t dw�ch tr�jk�t�w maj� te same rozmiary. Ten proces rozumowania wstecznego ko�czy si�, gdy to, co pozostaje do wykazania, nale�y do przes�anek twierdzenia. Czytelnicy zaznajomieni z geometri� b�d� mogli pod��a� za ilustracyjnym przyk�adem pokazanym na rysunku.

Tam po lewej stronie otrzymujemy tr�jk�t ABC o boku AB r�wnym boku AC i musimy udowodni�, �e k�t ABC jest r�wny k�towi ACB. Tr�jk�t po prawej stronie to odwr�cona wersja tr�jk�ta ABC. Oto dow�d: je�li mogliby�my udowodni�, �e tr�jk�t ABC jest przystaj�ce do tr�jk�ta , w�wczas nast�pi�oby to twierdzenie, poniewa� dwa k�ty s� odpowiednimi k�tami dw�ch tr�jk�t�w. Te dwa tr�jk�ty mo�na udowodni�, �e s� zgodne, gdyby�my mogli ustali�, �e bok AB (tr�jk�ta ABC) jest r�wny bokowi (tr�jk�ta ) i ten bok AC (tr�jk�ta ABC) jest r�wny bokowi (tr�jk�ta ) i �e k�t A (tr�jk�ta ABC) jest r�wny k�towi A (tr�jk�ta ). Ale przes�anki twierdz�, �e bok AB jest r�wny bokowi AC, a te d�ugo�ci nie zmieniaj� si� w tr�jk�cie ipped-over. Podobnie, k�t A jest r�wny jego wersji ipped-over {wi�c mamy nasz dow�d. Przed kontynuowaniem mojego opisu programu Gelerntera, kr�tka historia dygresja jest w porz�dku. Udowodnione w�a�nie twierdzenie o geometrii jest s�ynne {jest pi�t� propozycj� w Ksi�dze I Element�w Euklidesa. Poniewa� dow�d twierdzenia Euklidesa by� trudnym problemem dla pocz�tkuj�cych, sta� si� znany jako most pons asinorum lub most g�upc�w. "Dow�d podany tutaj jest prostszy ni� Euklidesa - jego wersj� poda� Pappus z Aleksandrii (oko�o 290-350 lat) "Symulacja r�ki" Minsky'ego programu do dowodzenia twierdze� w geometrii, om�wiona w Dartmouth, przynios�a ten w�a�nie dow�d (pomijaj�c to, co uwa�am za pomocny krok do przeskoczenia tr�jk�ta). Minsky napisa�

"W 1956 roku napisa�em dwie notatki o r�cznie symulowanym programie do dowodzenia twierdze� w geometrii. W pierwszej notatce procedura znalaz�a prosty dow�d, �e je�li tr�jk�t ma dwa r�wne boki, to odpowiednie k�ty s� r�wne. zauwa�aj�c, �e tr�jk�t ABC przystaje do tr�jk�ta CBA z powodu "boku-k�ta-boku". Co ciekawe, znaleziono to po bardzo kr�tkim wyszukiwaniu {bo przecie� nie by�o wiele rzeczy do zrobienia. mo�e powiedzie�, �e program by� zbyt g�upi, aby zrobi� to, co kto� m�g�by zrobi�, to znaczy pomy�le�: "Och, oba s� tym samym tr�jk�tem. Na pewno nic dobrego nie wyniknie z nadania mu dw�ch r�nych nazw. "(Program posiada zbi�r heurystycznych metod dowodzenia twierdze� podobnych do Euklidesa, a jednym z nich by�o to, �e je�li chcesz udowodni�, �e dwa k�ty s� r�wne, poka�, �e s� to odpowiadaj�ce sobie cz�ci przystaj�cych tr�jk�t�w. "Wtedy mia� te� kilka sposob�w na zademonstrowanie zgodno�ci. Nie by�o nic wi�cej w tym pierwszym ni� symulacja.) Ale nigdzie nie mog� znale�� tej notatki. "

Jak powiedzia� Minsky, jest to bardzo �atwy problem dla komputera. Program Gelernter okaza� si� znacznie trudniejszymi twierdzeniami, a do tego jego u�ycie diagramu by�o niezb�dne. Program dos�ownie nie narysowa� i nie spojrza� na schemat. Zamiast tego, jak napisa� Gelernter,

"[Program] jest dostarczany ze schematem w postaci listy mo�liwych wsp�rz�dnych dla punkt�w wymienionych w twierdzeniu. Tej li�cie punkt�w towarzyszy kolejna lista okre�laj�ca punkty po��czone segmentami. Wsp�rz�dne s� wybierane, aby odzwierciedli� najwi�ksza mo�liwa og�lno�� w postaciach. "

Na przyk�ad punkty wymienione w problemie dotycz�cym udowodnienia r�wno�ci dw�ch k�t�w s� wierzcho�kami tr�jk�ta ABC, a mianowicie punkty A, B i C. Wybrano wsp�rz�dne dla ka�dego z tych punkt�w i zadbano o to, aby upewni� si�, �e wsp�rz�dne te nie spe�niaj� �adnych specjalnych nienazwanych w�a�ciwo�ci. Program Gelerntera dzia�a�, konfiguruj�c podzadania i podzadania, takie jak te, kt�rych u�y�em w podanym przyk�adzie, a nast�pnie szuka� �a�cucha tych zako�czonych podzadaniami, kt�re mo�na by�oby ustali� bezpo�rednio z lokalu. Jednak zanim program zosta� wybrany do pracy z jakimkolwiek podzadaniem, najpierw przetestowano go, aby sprawdzi�, czy jest on utrzymany na schemacie. Je�li tak si� stanie, mo�e by� mo�liwe do udowodnienia i dlatego mo�e by� uwa�any za mo�liw� drog� do dowodu. Ale gdyby nie by�o tego na schemacie, nie mog�oby by� prawd�. W ten spos�b mo�na go wyeliminowa� z dalszych rozwa�a�, tym samym "przycinaj�c" drzewo wyszukiwania i oszcz�dzaj�c, co z pewno�ci� by�oby bezowocnym wysi�kiem. P�niejsze prace w AI wykorzystywa�yby r�wnie� tego rodzaju "semantyczne" informacje. Widzimy podobie�stwa mi�dzy strategiami stosowanymi w programie geometrii a strategiami stosowanymi przez ludzi podczas rozwi�zywania problem�w. Powszechne jest dla nas dzia�anie wstecz - przekszta�canie trudnego problemu w podproblemy i te w podproblemy i tak dalej, a� w ko�cu problemy s� trywialne. Kiedy podproblem sk�ada si� z wielu cz�ci, wiemy, �e musimy rozwi�za� je wszystkie. Rozumiemy r�wnie�, kiedy proponowany podproblem jest ewidentnie niemo�liwy i dlatego mo�emy go odrzuci�. Nast�pny program, kt�ry opisuj�, opiera� si� wyra�nie na tym, co jego autorzy uwa�ali za ludzkie strategie rozwi�zywania problem�w.

Og�lne rozwi�zanie problemu

Na tej samej konferencji w Pary�u w 1959 r., Na kt�rej Gelernter przedstawi� sw�j program, Allen Newell, J.C. Shaw i Herb Simon napisali artyku� opisuj�cy ich ostatnie prace nad mechanizacj� rozwi�zywania problem�w. Ich program, kt�ry nazwali "General Problem Solver (GPS)", by�o uciele�nieniem ich pomys��w na temat rozwi�zywania problem�w przez ludzi. Rzeczywi�cie twierdzili, �e sam program by� teori� ludzkich zachowa� zwi�zanych z rozwi�zywaniem problem�w. Newell i Simon byli w�r�d tych, kt�rzy byli r�wnie zainteresowani (by� mo�e nawet bardziej zainteresowani) wyja�nianiem inteligentnego zachowania ludzi podczas budowania inteligentnej maszyny Napisali

"Cz�sto twierdzi si�, �e nale�y wytyczy� ostro�n� granic� mi�dzy pr�b� wykonania na maszynach tych samych zada�, kt�re wykonuj� ludzie, a pr�b� symulacji proces�w, kt�rych ludzie faktycznie u�ywaj� do osi�gni�cia tych cel�w zadania ... GPS maksymalnie myli oba podej�cia - z obop�ln� korzy�ci�. "

GPS by� rezultatem wcze�niejszej pracy nad teori� logiki, poniewa� polega� na manipulowaniu strukturami symboli (w co, jak wierzyli, ludzie r�wnie�). Ale GPS mia� wa�ny dodatkowy mechanizm w�r�d swoich strategii manipulacji symbolami. Podobnie jak program geometrii Gelerntera, GPS przekszta�ci� problemy w podproblemy i tak dalej. Innowacja GPS polega�a na obliczeniu "r�nicy" mi�dzy problemem do rozwi�zania (przedstawionym jako struktura symbolu) a tym, co ju� by�o znane lub podane (przedstawione r�wnie� jako struktura symbolu). Nast�pnie program pr�bowa� zmniejszy� t� r�nic� poprzez zastosowanie operatora manipuluj�cego symbolami (znanego jako istotny dla tej r�nicy) do pocz�tkowej struktury symboli. Newell i Simon nazywali t� strategi� "oznacza - ko�czy analiz�." (Nale�y zwr�ci� uwag� na podobie�stwo do systemy kontroli sprz�enia zwrotnego, kt�re nieustannie staraj� si� zmniejszy� r�nic� mi�dzy bie��cym ustawieniem a po��danym ustawieniem.) Aby to zrobi�, musia�by wykaza�, �e spe�niono warunki zastosowania operatora {podproblem. Nast�pnie program uruchomi� kolejn� wersj� pracowa� nad tym podproblemem, szukam r�nicy i tak dalej. Za��my na przyk�ad, �e celem jest, aby Sammy by� w szkole, gdy wiadomo, �e Sammy jest w domu. GPS oblicza r�nic�, a mianowicie, �e Sammy jest w niew�a�ciwym miejscu i szuka operatora odpowiedniego do zmniejszenia tej r�nicy, a mianowicie: kierowanie Sammy do szko�y. Aby prowadzi� Sammy′go do szko�y, samoch�d musi by� sprawny. Aby problem by� interesuj�cy, przypuszczamy, �e akumulator samochodu jest roz�adowany, wi�c GPS nie mo�e zastosowa� operatora samochodu, poniewa� ten operator wymaga dzia�aj�cej baterii. Uzyskanie dzia�aj�cej baterii jest podproblemem, do kt�rego GPS mo�e zastosowa� w�asn� wersj�. Ta "ni�sza" wersja GPS oblicza r�nic�, a mianowicie zapotrzebowanie na dzia�aj�c� bateri�, i okre�la operatora, a mianowicie , wzywaj�c mechanika, by przyszed� i zainstalowa� now� bateri�. Aby zadzwoni� do mechanika, trzeba mie� numer telefonu (i za��my, �e go mamy), wi�c GPS stosuje operatora mechanika wywo�ywania, co powoduje, �e mechanik nadchodzi, aby zainstalowa� now� bateri�. Ni�sza wersja GPS z powodzeniem rozwi�za�a problem, wi�c nadrz�dny GPS mo�e teraz wznowi� {zauwa�aj�c, �e warunek prowadzenia samochodu, a mianowicie posiadanie dzia�aj�cego akumulatora, jest spe�niony. Tak wi�c GPS stosuje tego operatora, Sammy dostaje si� do szko�y, a pierwotny problem zosta� rozwi�zany. (Ten przyk�ad ilustruje og�lne dzia�anie GPS. Prawdziwy, wykorzystuj�cy rzeczywiste struktury symboli, r�nice i operator�w z ich warunkami itd. By�by uci��liwy, ale nie bardziej odkrywczy.) Gdy GPS dzia�a na podproblemy, uruchamiaj�c now� wersj� siebie , wykorzystuje bardzo wa�ny pomys� w informatyce (i matematyce) o nazwie "rekurencja". By� mo�e znasz pomys�, �e programi�ci komputerowi organizuj� z�o�one programy w spos�b hierarchiczny. Oznacza to, �e programy g��wne ponownie uruchamiaj� podprogramy, kt�re mog� ponownie uruchamia� podprogramy i tak dalej. Kiedy program g��wny "wywo�uje" podprogram, program g��wny zawiesza si�, dop�ki podprogram nie doko�czy tego, co powinien zrobi� (ewentualnie przekazuj�c dane do programu g��wnego), a nast�pnie program g��wny wznowi prac�. W sztucznej inteligencji (a tak�e w innych aplikacjach) cz�sto program g��wny wywo�uje swoj� wersj� - uwa�aj�c, aby nowa wersja dzia�a�a na prostszym problemie, aby unikn�� nieko�cz�cych si� powt�rze� i "zap�tlania". Samo wywo�anie programu nazywa si� "rekurencj�". Czy ludzie u�ywaj� podprogram�w i rekurencji we w�asnym my�leniu? Ca�kiem mo�liwe, ale ich zdolno�� do przypominania sobie, jak wznowi� to, co robi� pewien proces my�lowy wy�szego poziomu, gdy proces ten rozpoczyna �a�cuch proces�w ni�szego poziomu, jest z pewno�ci� ograniczona. Nie wierz�, �e GPS pr�bowa� na�ladowa� to ograniczenie ludzkiego my�lenia. Newell i Simon wierzyli, �e metody stosowane przez GPS mog� by� wykorzystane do rozwi�zania wielu r�nych problem�w, tworz�c w ten spos�b poj�cie "og�lne". Aby zastosowa� go do konkretnego problemu, nale�a�oby dostarczy� "tabel� r�nic" dla tego problemu. W tabeli wymieniono wszystkie mo�liwe r�nice, kt�re mog� si� pojawi�, i dopasowano je do operator�w, co w przypadku tego problemu zmniejszy�oby odpowiadaj�ce r�nice. GPS zosta� w rzeczywisto�ci zastosowany do szeregu r�nych problem�w logicznych i zagadek i zainspirowa� p�niejsze prace zar�wno w zakresie sztucznej inteligencji, jak i kognitywistyki. Jego d�ugowieczno�� jako samego programu rozwi�zywania problem�w i jako teorii rozwi�zywania problem�w ludzkich by�a jednak kr�tka i przetrwa�a tylko dzi�ki r�nym potomkom (o kt�rych wi�cej om�wimy p�niej). W wielu programach AI opracowanych na pocz�tku lat 60. XX wieku zastosowano procedury wyszukiwania heurystycznego. Na przyk�ad inny doktor Minsky'ego studenci, James Slagle, zaprogramowali system o nazwie SAINT, kt�ry mo�e rozwi�zywa� problemy rachunku r�niczkowego, odpowiednio reprezentowanego jako struktury symboli. Rozwi�zano 52 z 54 problem�w zaczerpni�tych z rachunku pierwszego stopnia MIT. Wiele program�w heurystycznych wykorzystano w programach, kt�re mog�y gra� w gry planszowe, a teraz zajm� si� nimi.

Programy gier

Wspomnia�em ju� o niekt�rych wczesnych pracach Shannona i Newella, Shawa i Simona nad programami do gry w szachy. Gra w doskona�e szachy wymaga inteligencji. W rzeczywisto�ci Newell, Shaw i Simon napisali, �e "je�li mo�na opracowa� udan� maszyn� do gry w szachy, wydaje si�, �e przenikn�� do rdzenia ludzkich wysi�k�w intelektualnych". My�lenie o programach do gry w szachy wraca przynajmniej do Babbage. Wed�ug Murraya Campbella, badacza IBM, kt�ry pom�g� zaprojektowa� mistrzowski program do gry w szachy (o kt�rym wspomn� p�niej), ksi��ka Babbag′a z 1845 r., �ycie filozofa, zawiera pierwsz� udokumentowan� dyskusj� na temat programowania komputera do gry w szachy . Konrad Zuse, niemiecki projektant i konstruktor komputer�w Z1 i Z3, wykorzysta� sw�j j�zyk programowania o nazwie Plankalkul do zaprojektowania programu do gry w szachy na pocz�tku lat 40. XX wieku. W 1946 r. Turing wspomnia� o komputerze pokazuj�cym "inteligencj�", kt�rego paradygmatem jest gra w szachy. W 1948 r. Turing i jego by�y kolega ze studi�w, D. G. Champernowne, zacz�li pisa� program do gry w szachy w 1952 r., nie maj�c komputera wystarczaj�co mocnego, aby uruchomi� program, Turing gra� w gr�, w kt�rej symulowa� komputer, zabieraj�c oko�o p� godziny na ruch. (Gra zosta�a nagrana. Mo�na j� zobaczy� na stronie :
http://www.chessgames.com/perl/chessgamegid=1356927.
Program przegra� z koleg� Turinga, Alickem Glennie; m�wi si� jednak, �e program wygra� mecz z �on� Champernowne. Po tych wczesnych programach prace nad komputerowymi programami szachowymi by�y kontynuowane, z wysi�kiem od pocz�tku do ko�ca, przez nast�pne kilka dekad. Wed�ug Johna McCarthy'ego Alexander Kronrod, rosyjski badacz sztucznej inteligencji, powiedzia�: "Szachy to Drosophila AI" - co oznacza, �e s�u�y lepiej ni� bardziej otwarte zadania intelektualne jako przydatny okaz laboratoryjny do bada�. Jak powiedzia� Minsky:

"Nie chodzi o to, �e gry i problemy matematyczne s� wybierane, poniewa� s� jasne i proste; raczej dlatego, �e daj� one najmniejszym strukturom pocz�tkowym najwi�ksz� z�o�ono��, dzi�ki czemu mo�na zaanga�owa� si� w naprawd� gro�ne sytuacje po wzgl�dnie minimalnym przej�ciu na programowanie "

. Szachy stanowi� bardzo trudne problemy dla AI i dopiero w po�owie lat 60. pojawi�y si� pierwsze kompetentne programy szachowe. Bardziej wczesny sukces osi�gni�to jednak w przypadku prostszej gry w warcaby (lub warcab�w, jak ta gra znana jest w brytyjskim angielskim). Arthur Samuel zacz�� my�le� o programowaniu komputera do gry w warcaby pod koniec lat 40. na University of Illinois, gdzie by� profesorem in�ynierii elektrycznej. W 1949 roku do��czy� do laboratorium Poughkeepsie Laboratory w IBM i uko�czy� sw�j pierwszy program sprawdzania dzia�ania w 1952 roku na komputerze IBM 701. Program zosta� przekodowany dla IBM 704 w 1954 r. Wed�ug Johna McCarthy′ego, "Thomas J. Watson Sr., za�o�yciel i prezes IBM, zauwa�y�, �e demonstracja [programu Samuela] podniesie cen� akcji IBM o 15 punkt�w. Tak. ". [Najwyra�niej Samuel nie by� pierwszym, kt�ry napisa� program do gry w warcaby. Wed�ug Encyklopedii Brittanica, Online," Pierwszy udany program sztucznej inteligencji zosta� napisany w 1951 r. przez Christophera Stracheya, p�niejszego dyrektora Programming Research Group w University of Oxford. Program warcab�w (szkic�w) Stracheya dzia�a� na komputerze Ferranti Mark I na University of Manchester, Anglia. Do lata 1952 r. Program ten m�g� zagra� w pe�n� gr� w warcaby z rozs�dn� pr�dko�ci�"] .G��wnym zainteresowaniem Samuela w programowaniu komputera do grania w warcaby by�o zbadanie, jak zdoby� komputer do nauki. Uznanie" czasoch�onnej i kosztownej procedury " "zaanga�owany w programowanie, Samuel napisa�:" Programowanie komputer�w w celu uczenia si� na podstawie do�wiadczenia powinno ostatecznie wyeliminowa� potrzeb� znacznej cz�ci tych szczeg�owych prac programistycznych. "Wysi�ki Samuela by�y jednymi z pierwszych, kt�re mia�y sta� si� bardzo wa�n� cz�ci� sztucznej inteligencji, a mianowicie: "uczenie maszynowe". Jego pierwszy program obejmuj�cy uczenie si� zosta� uko�czony w 1955 r. i zademonstrowany w telewizji 24 lutego 1956 r. Przed opisaniem jego metod uczenia si� opisz� og�lnie, w jaki spos�b Program Samuela wybra� ruchy. Technika ta jest bardzo podobna do tego, w jaki spos�b wybrano ruchy w o�miu puzzlach opisanych wcze�niej. Z wyj�tkiem teraz nale�y przewidzie� fakt, �e przeciwnik r�wnie� wybiera ruchy. Ponownie powstaje drzewo wyra�e� symbolicznych reprezentuj�cych pozycje na planszy. Pocz�wszy od konfiguracji pocz�tkowej, rozwa�ane s� wszystkie mo�liwe ruchy programu (przy za�o�eniu, �e program porusza si� jako pierwszy). Rezultatem s� wszystkie mo�liwe wynikaj�ce z tego konfiguracje rozga��ziaj�ce si� od konfiguracji pocz�tkowej. Nast�pnie z ka�dego z nich brane s� pod uwag� wszystkie mo�liwe ruchy przeciwnika - w wyniku czego powstaje wi�cej ga��zi i tak dalej. Gdyby takie drzewo mo�na by�o zbudowa� dla ca�ej gry, ruch wygrywaj�cy mo�na by obliczy� na podstawie badania drzewa. Niestety oszacowano, �e istnieje oko�o 5 x 10²⁰ mo�liwych pozycji kontroler�w. Wiod�cy ekspert w programowaniu komputer�w do grania w gry, Jonathan Schaeffer, by� w stanie "rozwi�za�" warcaby (pokazuj�c, �e optymalna gra obu graczy ko�czy si� remisem) poprzez czasoch�onn� analiz� oko�o 10¹⁴ pozycji. Napisa� mi, �e "By� to wynik licznych ulepsze� ukierunkowanych na wyszukiwanie w tych cz�ciach przestrzeni wyszukiwania, w kt�rych najprawdopodobniej znale�li�my to, czego potrzebowali�my". Program Samuela m�g� koniecznie skonstruowa� tylko cz�� drzewa - to znaczy, m�g� patrze� tylko o kilka ruch�w do przodu. To, jak daleko to wygl�da�o, wzd�u� r�nych ga��zi, zale�a�o od wielu czynnik�w, kt�re nie musz� nas tutaj dotyczy�. (Dotyczy�y one takich kwestii, czy mo�liwe by�o natychmiastowe z�apanie). Typowe jest patrzenie w przysz�o�� z wykorzystaniem trzech ruch�w, chocia� niekt�re ga��zie mog� by� eksplorowane (rzadko) na g��boko�� a� dziesi�ciu ruch�w. Schemat z pracy Samuela przedstawia og�lny pomys�. Samuel powiedzia�, �e "faktyczne rozga��zienia s� znacznie liczniejsze". Jak wi�c program wybiera ruch z tak niekompletnego drzewa? Problem ten napotykaj� wszystkie programy do grania i wszystkie wykorzystuj� metody polegaj�ce na obliczaniu wyniku dla pozycji na ko�cach lub "li�ciach" drzewa (to znaczy li�ci niekompletnego drzewa wygenerowanych przez program ), a nast�pnie "migruje" ten wynik z powrotem do pozycji wynikaj�cych z ruch�w z bie��cej pozycji. Najpierw opisz�, jak obliczy� wynik, a nast�pnie jak go przenie�� z powrotem, a nast�pnie w jaki spos�b Samuel zastosowa� metody uczenia si� w celu poprawy wydajno�ci. Program Samuela najpierw obliczy� punkty, kt�re maj� by� przyznane pozycjom na li�ciach drzewa na podstawie ich og�lnej \ dobroci "z punktu widzenia programu. W�r�d cech, kt�re przyczyni�y si� do punkt�w, by�a wzgl�dna przewaga w kawa�kach (kr�lowie byli warti wi�cej ni� zwyk�e elementy), og�lna "mobilno��" (swoboda poruszania si�) element�w programu i sterowanie centralne (program mia� dost�p do 38 takich funkcji, ale wykorzysta� tylko 16 z nich w tym samym czasie.) Punkty wniesione przez ka�da cecha zosta�a nast�pnie pomno�ona przez "wag�" (odzwierciedlaj�c wzgl�dn� wa�no�� odpowiadaj�cej jej cechy), a wynik zosta� zsumowany, aby da� og�lny wynik dla pozycji. Zaczynaj�c od pozycji bezpo�rednio powy�ej pozycji na ko�cu drzewa, je�li jest to pozycja, dla kt�rej nadesz�a kolej na program, mo�emy za�o�y�, �e program chcia�by przej�� do tej pozycji z najwy�szym wynikiem, aby najwy�szy wynik zosta� przeniesiony z powrotem do tej pozycji "bezpo�rednio powy�ej". Je�li jednak , jest to pozycja, z kt�rej kolej ruchu przeciwnika, zak�adamy, �e przeciwnik chcia�by przej�� do tej pozycji z najni�szym wynikiem. W takim przypadku najni�szy wynik jest migrowany z powrotem do tego miejsca bezpo�rednio powy�ej pozycji. Ta naprzemiennie "najwy�sza - najni�sza" strategia migracji jest kontynuowana a� do ko�ca drzewa i nazywa si� strategi� minimax. [Prosta modyfikacja tej strategii, zwana procedur� "alpha -beta", s�u�y do wnioskowania ( poprawnie) z ju� migrowanych wynik�w, �e niekt�re ga��zie nie musz� by� wcale badane {umo�liwiaj�c w ten spos�b g��bsze zbadanie innych ga��zi. R�ni si� opinie na temat tego, kto pierwszy pomy�la� o tej wa�nej modyfikacji. McCarthy, Newell i Simon wszyscy roszcz� o uznanie. Samuel powiedzia� mi, �e go u�y�, ale �e jest zbyt oczywiste, aby o nim pisa�.] Je�li za�o�ymy, �e kolej� programu jest przej�cie z bie��cej pozycji i �e wyniki zosta�y ju� przeniesione z powrotem do pozycji tu� pod ni�, program przesun��by si� na t� pozycj� z najwy�szym wynikiem. A potem gra b�dzie kontynuowana, gdy przeciwnik wykona ruch, kolejny etap wzrostu drzewa, obliczania wyniku i migracji itd., Dop�ki jedna strona nie wygra lub przegra. Jedna z metod uczenia si� w programie Samuela dostosowa�a warto�ci wag stosowanych przez system punktacji. (Przypomnijmy, �e korekty masy w Pandemonium i sieciach neuronowych by�y sposobami uczenia si� tych system�w). Wagi zosta�y dostosowane tak, aby wynik pozycji planszy (obliczony na podstawie sumy wa�onych ocen cech) zbli�y� si� do warto�ci f migrowany wynik po zako�czeniu wyszukiwania. Na przyk�ad, je�li wynik pocz�tkowej pozycji zosta� obliczony (przy u�yciu wag przed dostosowaniem) jako 22, a migrowany wynik tej pozycji po wyszukiwaniu wynosi� 30, to wagi u�yte do obliczenia wyniku pocz�tkowej pozycji zosta�y dostosowane w spos�b, dzi�ki kt�remu nowy wynik (przy u�yciu skorygowanej warto�ci wag) zosta� przybli�ony do 30, powiedzmy 27. (Ta technika zapowiedzia�a bardzo wa�n� metod� uczenia si�, sformu�owan� p�niej przez Richarda Suttona, zwan� "uczeniem si� r�nic czasowych"). Pomys� tutaj migracja wyniku, zale�nie od tego, jak wygl�da�o w przysz�o�ci, by�a lepsza ni� pierwotna ocena. W ten spos�b poprawiono procedur� szacowania, dzi�ki czemu uzyskano warto�ci bardziej sp�jne z wynikiem "wybiegaj�cym w przysz�o��". Samuel zastosowa� tak�e inn� metod� zwan� "rote learning", w kt�rej program zapisywa� r�ne pozycje planszy i migrowane wyniki napotkane podczas rzeczywistej gry. Nast�pnie, pod koniec wyszukiwania, czy napotkana pozycja li�cia by�a taka sama jak jedna z tych zapisanych pozycji , jego wynik by� ju� znany (i nie musia�by by� obliczany przy u�yciu wag i cech). Znany wynik, oparty na poprzednim badaniu, prawdopodobnie by�by lepszym wska�nikiem warto�ci pozycji ni� wynik obliczony. Program Samuela r�wnie� skorzysta� z u�ycia \ book games, kt�re s� zapisami gier g��wnych graczy w warcaby. Komentuj�c prac� Samuela, John McCarthy napisa�, �e gracze w warcaby maj� wiele gier z komentarzami, w kt�rych dobre ruchy odr�niaj� si� od z�ych. Program edukacyjny Samuela wykorzysta� Przewodnik po warcabach Lee, aby dostosowa� kryteria wyboru ruch�w, tak aby program wybra� te dobrze przemy�lane przez ekspert�w sprawdzania tak cz�sto, jak to mo�liwe. " Program Samuela gra� bardzo dobrze w warcaby, a latem 1962 roku pokona� Roberta Nealeya, mistrza niewidomych warcab�w z Connecticut. (Mo�esz zobaczy� gr� rozgrywan� pomi�dzy Mr. Nealey a programem Samuela na stronie http: // www. Erz.ch/samuel.htm.) Ale, wed�ug Jonathana Schaeffera i Roberta Lake'a: "W 1965 r. Program gra� po cztery gry przeciwko Walterowi Hellmanowi i Derekowi Oldbury (nast�pnie graj�c w meczu o mistrzostwo �wiata) i przegrali wszystkie osiem gier "

Historia Sztucznej InteligencjiArtificial Intelligence Experts

Teoria logiki i wyszukiwania heurystyczne