Post�p w NLP

Jak wspomniano wcze�niej, problemy ze zrozumieniem, generowaniem i t�umaczeniem materia��w w zwyk�ych j�zykach ludzkich (a nie komputerowych) nale�� do kategorii przetwarzania j�zyka naturalnego. Podczas fazy "wczesnych eksploracji" bada� nad sztuczn� inteligencj� poczyniono pewne dobre pocz�tki dotycz�ce problem�w NLP. W kolejnej fazie, od ko�ca lat sze��dziesi�tych do wczesnych lat siedemdziesi�tych, na tych fundamentach opracowano nowe prace, co opisz� w tej cz�ci ksi��ki.

T�umaczenie maszynowe

W. John Hutchins, kt�ry napisa� obszernie o historii t�umaczenia maszynowego (MT), nazwa� lata 1967-1976 "spokojn� dekad�". Brak aktywno�ci w tym okresie wynika cz�ciowo z raportu ALPAC, co, jak ju� powiedzia�em, by�o pesymistyczne co do perspektyw t�umaczenia maszynowego. Hutchins stwierdzi�:

"Raport ALPAC by� g��boki. Przez ponad dekad� wirtualnie zako�czy� badania MT w USA, a MT przez wiele lat postrzegano jako ca�kowit� pora�k�. . . . Dzia�alno�� MT przenios�a si� ze Stan�w Zjednoczonych na Kanad� i Europ�. "

Jednym z wyj�tk�w od tego trwaj�cego dekad� zastoju w Stanach Zjednoczonych by�o opracowanie programu t�umacze� Systran (System Translator) autorstwa Petr Toma, komputerowca urodzonego na W�grzech naukowca i j�zykoznawc�, kt�ry pracowa� nad systemem t�umacze� rosyjsko-angielskiego w Georgetown W 1968 r. Toma za�o�y� firm� o nazwie Latsec, Inc. w La Jolla w Kalifornii, aby kontynuowa� prace rozwojowe Systran, kt�re rozpocz�� wcze�niej w Niemczech Si�y powietrzne Stan�w Zjednoczonych zawar�y umow� na opracowanie systemu t�umacze� z j�zyka rosyjskiego na angielski. Przetestowano go na pocz�tku 1969 r. W bazie si� powietrznych Wright-Patterson w Dayton w stanie Ohio, gdzie nadal zapewnia rosyjskie {angielskie t�umaczenia dla Departamentu Technologii Zagranicznych USAF do dzi�. "Systran ewoluowa� jako jeden z g��wnych automatycznych system�w t�umacze�. Jest sprzedawany przez Imageforce Corporation w Tampie na Florydzie. Jak dobrze Systran t�umaczy? Wszystko zale�y jak chce si� mierzy� wydajno��. Margaret Boden wymienia dwie miary, a mianowicie "zrozumia�o��" i "poprawno��". Oba te �rodki zale�� od ludzkiego os�du. Po pierwsze, pytamy: "Czy t�umaczenie mo�na og�lnie zrozumie�?" Po drugie, pytamy: "Czy ludzcy" redaktorzy "musz� zmodyfikowa� t�umaczenie?" Boden twierdzi, �e "w dwuletnim okresie od 1976 do 1978 r. zrozumia�o�� t�umacze� generowanych przez Systran wzros�a z 45 do 78 procent dla [wprowadzania tekstu surowego]." Zauwa�a r�wnie�, �e t�umaczenia ludzkie maj� tylko 98 do 99 procent , nie 100 procent. Je�li chodzi o poprawno��, Boden twierdzi, �e w 1978 r. "Tylko 64 procent s��w pozosta�o nietkni�tych przez post-redaktor�w. Mimo to, ludzka post-edycja strony wynik�w Systran zaj�a tylko dwadzie�cia minut w po�owie lat osiemdziesi�tych, podczas gdy normalne ( t�umaczenie w pe�ni ludzkie) zaj�oby godzin�.

Zrozumienie

Chocia� prze�om lat sze��dziesi�tych i siedemdziesi�tych m�g� by� "cich� dekad�" w t�umaczeniu maszynowym, by� to bardzo aktywny okres dla innych prac NLP. W tych latach badacze zastosowali znacznie silniejsze zdolno�ci syntaktyczne, semantyczne i wnioskowania do problemu zrozumienia j�zyka naturalnego. Typow� dla nowego podej�cia by�a obserwacja doktora Terry′ego Winograda, doktora MIT pod koniec lat 60. XX wieku: Je�li naprawd� chcemy, aby komputery nas rozumia�y, musimy da� im mo�liwo�� korzystania z wi�kszej wiedzy. do gramatyki j�zyka, musz� mie� wszelkiego rodzaju wiedz� na temat, kt�ry omawiaj�, i musz� u�y� rozumowania, aby po��czy� fakty we w�a�ciwy spos�b, aby zrozumie� zdanie i odpowiedzie� na nie. Proces rozumienia zdania musi ��czy� gramatyk�, semantyk� i rozumowanie w bardzo intymny spos�b, wzywaj�c ka�d� stron� do pomocy innym.

13.2.1 SHRDLU

By� mo�e osi�gni�ciem NLP, kt�re wywo�a�o najwi�ksze podekscytowanie, by� system dialogowy j�zyka naturalnego SHRDLU zaprogramowany przez Terry′ego Winograda dla jego doktoratu. Rozprawa (podu Seymoura Paperta) w MIT SHRDLU by�a w stanie prowadzi� dialog na temat tego, co Winograd nazwa� "mikro�wiatem", �wiatem sk�adaj�cym si� z blok�w zabawek i "chwytaka" do ich przemieszczania. W przeciwie�stwie do �wiata prawdziwych blok�w u�ywanych w poprzednich badaniach MIT i Stanforda, �wiat blok�w Winograda by� symulowany na komputerze DEC PDP-10 i ogl�dany na czarno-bia�ym ekranie graficznym DEC 340, takim jak pokazany poni�ej

SHRDLU mo�e otrzyma� polecenia wpisane zwyk�ym angielskim, aby manipulowa� blokami za pomoc� jego chwytaka. Mo�na by r�wnie� zadawa� pytania o stan jego �wiata. M�g� "zrozumie�" te polecenia i pytania, wykona� ��dane manipulacje i zada� u�ytkownikowi wyja�nienie pyta� w j�zyku angielskim na temat pyta� lub polece�, kt�rych nie rozumia�. Przed opisaniem czego� na temat projektu SHRDLU, sp�jrzmy na przyk�ad cz�ci okna dialogowego. Poni�ej dane wej�ciowe u�ytkownika s� ponumerowane i pokazane ma�ymi literami, a odpowied� SHRDLU jest pisana wielkimi literami, komentarz Winograda nast�puje tym samym krojem pisma, a m�j w nawiasach normalnym typem:

1. podnie� du�y czerwony blok.
Aby podnie�� czerwony blok, musisz go usun�� aby odszuka� miejsce na zielony i przesu� zielony z dala.
OK
System odpowiada "OK", gdy wykonuje polecenie.
(Nie zawracam sobie g�owy pokazaniem, jak wygl�da konfiguracja bloku w trakcie dialogu, zak�adaj�c, �e mo�esz u�y� w�asnego modelu umys�u "do �ledzenia rzeczy". Chwytak trzyma teraz czerwony blok.)

2. chwy� piramid�.
Na scenie s� trzy piramidy, wi�c program nic nie robi.
NIE ZROZUMIEM, CO OZNACZA. PIRAMIDA

3. znajd� blok, kt�ry jest wy�szy ni� ten, kt�ry trzymasz i umie�� go w pude�ku. (U�ytkownik najwyra�niej teraz zmieni� zdanie na temat chwytania piramid). System musi ustali�, co nale�y rozumie� przez "jeden" i "to", a tak�e za pomoc� dedukcji, aby zdecydowa�, kt�ry blok trzyma.
"IT", PRZYJMUJ�, �E OZNACZASZ BLOK, KT�RY JEST WY�SZY NI� TEN KT�RY TRZYMAM.
Wydrukowano, aby nas informowa�. R�ka musi od�o�y� czerwony blok, aby podnie�� wy�szy niebieski.
OK.
4. co zawiera pude�ko?
NIEBIESKI PIRAMIDA I NIEBIESKI BLOK.
5. na czym opiera si� piramida?
Wcze�niej system odpowiedzia� "piramid�", m�wi�c
"Nie rozumiem, kt�r� piramid� masz na my�li". teraz wie, �e musimy mie� na my�li ten, o kt�rym w�a�nie wspomniano.
PUDE�KO

To okno dialogowe ilustruj�ce mo�liwo�ci SHRDLU jest kontynuowane dla czterdziestu dw�ch dodatkowych danych wej�ciowych i odpowiedzi systemowych. Aby zaanga�owa� si� w takie dialogi, SHRDLU potrzebowa�a "wiedzy. "Musia�a wiedzie� o sk�adni u�ywanej cz�ci j�zyka angielskiego i musia�a wiedzie�, co oznaczaj� r�ne s�owa i kombinacje s��w w kontek�cie ich u�ycia. wiedzie� o �wiecie blok�w {jak manipulowa� blokami i co to znaczy, �e obiekt znajduje si� w "pude�ku". Musia� �ledzi� okno dialogowe, aby m�g� zdecydowa�, do kt�rego obiektu wspomniano wcze�niej s�owo takie jak "to", o kt�rym mowa. Ca�a ta potrzebna wiedza by�a reprezentowana w programach LISP lub "procedurach", jak je nazywa� Winograd. Wiedza na temat sk�adni by�a reprezentowana jako zbi�r procedur opartych na zasadach "gramatyki systemowej". Wiedza o znaczeniu s��w w kontek�cie by�a reprezentowana w procedurach, kt�re mog�yby odnosi� si� do s�ownika znacze� s��w, do innych cz�ci zdania, w kt�rym u�yto tego s�owa, oraz do dyskursu. Wiedza na temat �wiata blok�w by�a reprezentowana na dwa sposoby: istnia� model, kt�ry podawa� lokalizacje wszystkich obiekt�w oraz istnia�y procedury, kt�re mog� wnioskowa� o przewidywanych efektach (w modelu) manipulacji przez chwytak na r�nych obiektach. Procedury przemieszczania obiekt�w zawiera�y informacje zar�wno o warunkach wst�pnych, jak i o skutkach tych manipulacji. Procedury te zosta�y zakodowane w wersji j�zyka PLANNER firmy Hewitt, kt�ra, jak wspomniano wcze�niej, by�a w pewnym stopniu podobna do operator�w STRIPS. Zastosowano dodatkowe procedury w j�zyku PLANNER dla innych rodzaj�w wnioskowania potrzebnych przez system. Regu�y logiczne zosta�y wyra�one jako programy, kt�re by�y w stanie dokonywa� zar�wno dedukcji do przodu, jak i do ty�u. Procesy SHRDLU do rozumienia j�zyka mo�na podzieli� na trzy cz�ci, a mianowicie sk�adni�, semantyk� i wnioskowanie, ale jest to nieco wprowadzaj�ce w b��d, poniewa� wzajemne oddzia�ywanie tych cz�ci by�o kluczow� cech� systemu. Jak stwierdzi� Winograd:

"Poniewa� ka�dy kawa�ek wiedzy mo�e by� procedur�, mo�e on przywo�a� dowoln� inn� wiedz� dowolnego rodzaju". Na przyk�ad Winograd napisa�: "Gdy wyszukuje ka�dy kawa�ek struktury syntaktycznej, sprawdza jego semantyczny interpretacji, najpierw, aby sprawdzi�, czy jest to prawdopodobne, a nast�pnie (je�li to mo�liwe), aby sprawdzi�, czy jest to zgodne ze znajomo�ci� systemu przez �wiat, zar�wno konkretn�, jak i og�ln�."

Proceduralne przedstawienie wiedzy przez Winograd (wraz z j�zykiem Hewitta PLANNER do kodowania takich reprezentacji) mo�na skontrastowa� z wykorzystaniem przez McCarthy′ego formu� logicznych do deklaratywnego reprezentowania wiedzy. Sukces SHRDLU podsyci� debat� w�r�d badaczy AI na temat zalet i wad tych dw�ch strategii reprezentacji wiedzy - proceduralnej kontra deklaratywnej. W rzeczywisto�ci u�ycie LISP do reprezentowania procedur zaciera to rozr�nienie do pewnego stopnia, poniewa�, jak zauwa�y� Winograd, "LISP pozwala nam traktowa� programy jako dane, a dane jako programy". Tak wi�c, chocia� wiedza SHRDLU by�a reprezentowana proceduralnie, by�a w stanie w��czy� do swoich procedur pewn� now� deklaratywn� wiedz� (przedstawian� jako zdania angielskie). Wydajno�� HRDLU by�a naprawd� imponuj�ca i wzbudzi�a optymizm w�r�d niekt�rych badaczy j�zyka naturalnego odno�nie przysz�ego sukcesu. Jednak Winograd wkr�tce porzuci� t� lini� bada� na rzecz pracy nad interakcj� komputer�w i ludzi. By� mo�e dlatego, �e mia� do�wiadczenie z pierwszej r�ki, ile wiedzy by�o potrzebne do udanego rozumienia j�zyka w czym� tak prostym, jak �wiat blok�w, dlatego nie chcia� dawa� komputerom wystarczaj�cej wiedzy, aby powieli� pe�ny zakres ludzkich umiej�tno�ci werbalnych. W e-mailu z 2004 roku Winograd umie�ci� umiej�tno�ci SHRDLU w kontek�cie umiej�tno�ci ludzi: istniej� fundamentalne r�nice mi�dzy sposobem dzia�ania SHRDLU i jego krewnych, a tym, co dzieje si� w naszych m�zgach. Nie s�dz�, aby obecne badania poczyni�y du�y post�p w przekraczaniu tej przepa�ci, a odpowiednia nauka mo�e potrzebowa� dziesi�cioleci lub wi�cej, aby doj�� do punktu, w kt�rym pocz�tkowe ambicje staj� si� realistyczne. W mi�dzyczasie AI zaj�a si� znacznie bardziej wykonalnymi celami pracy w mniej ambitnych niszach lub akceptowania wynik�w innych ni� ludzkie (jak w t�umaczeniu),

LUNAR

Po powrocie z pierwszego za�ogowego l�dowania na Ksi�ycu astronauci Apollo 11 przynie�li kilka kilogram�w ksi�ycowych ska� do bada� naukowych. R�ne dane o tych ska�ach by�y przechowywane w bazach danych, do kt�rych geologowie i inni naukowcy mieli dost�p. Aby u�atwi� wyszukiwanie tych informacji geologom ksi�ycowym, NASA zapyta�a Williama A. Woodsa, m�odego informatyka z BBN, o mo�liwo�� zaprojektowania pewnego rodzaju "frontonu" w j�zyku naturalnym, aby zamiast tego mo�na by�o przeszukiwa� bazy danych w j�zyku angielskim w tajemnym kodzie komputerowym. Woods w�a�nie uko�czy� doktorat, badania na Harvardzie o systemach odpowiadania na pytania. Sponsorowany przez za�ogowe centrum kosmiczne NASA, koledzy Woodsa z BBN, Ron Kaplan i Bonnie Webber, opracowali system, kt�ry nazwali "LUNAR", odpowiadaj�c na pytania dotycz�ce ska� ksi�ycowych. LUNAR u�y� obu proces�w syntaktycznych i semantycznych przekszta�caj�ce angielskie pytania w zapytania do bazy danych ksi�ycowej ska�y. Analiz� syntaktyczn� przeprowadzono przy u�yciu "rozszerzonych sieci przej�ciowych" (ATN), metodologii opracowanej przez Woodsa podczas jego doktoratu na Harvardzie. Sk�adnik semantyczny, kierowany przez drzewa parsowania pochodz�ce z ATN, przekszta�ci�y zdania angielskie w co�, co Woods nazwa� "znaczeniem j�zyka reprezentacji" (MRL). Ten j�zyk by� j�zykiem logicznym ( jak rachunek predykat�w), ale rozszerzony o procedury, kt�re mo�na wykona�. MRL zosta� pierwotnie opracowany przez Woodsa z Harvardu i rozwini�ty w BBN. LUNAR by� w stanie "zrozumie�" i odpowiedzie� na wiele r�nych pyta�, w tym na przyk�ad: "Jakie jest �rednie st�enie glinu w ska�ach o wysokiej zawarto�ci alkali�w?" "Ile brekcji zawiera oliwin?" "Co to jest?" (LUNAR uzna�, �e "odnosz� si�" do brekcji wymienionych jako odpowiedzi na ostatnie pytanie.) LUNAR by� pierwszy system odpowiadaj�cy na pytania s�u��cy do publikowania danych dotycz�cych wynik�w. Uda�o mu si� odpowiedzie� z powodzeniem na 78% pyta� zadanych mu przez geolog�w podczas drugiej dorocznej konferencji naukowej po�wi�conej Ksi�ycowi, kt�ra odby�a si� w Houston w styczniu 1971 r. Podobno 90% by�oby odpowiedzi� w stanie z "drobnymi porawkami" do systemu. W przem�wieniu LUNAR z czerwca 2006 r. Woods wspomnia� o niekt�rych jego ograniczeniach. Poni�sze okno dialogowe ilustruje jedn� wad�:

U�ytkownik: Co to jest breccia?
LUNAR: S10018.
U�ytkownik: Co to jest S10018?
LUNAR: S10018.

Woods powiedzia�:

"LUNAR po prostu odnajduje odniesienia do wyra�e� odsy�aj�cych i podaje ich nazwy. Nie ma modelu celu za pytaniem u�ytkownika ani r�nego rodzaju odpowiedzi dla r�nych cel�w".

Chocia� LUNAR m�g� rozpozna� kilka r�nych sposob�w sformu�owania zasadniczo tego samego pytania, Woods stwierdzi�, �e "istniej� inne ��dania, kt�re (z powodu ogranicze� w obecnej gramatyce) musz� zosta� okre�lone w okre�lony spos�b, aby gramatyka je parsowa�a i tam s� inne, kt�re s� rozumiane przez interpretatora semantycznego tylko wtedy, gdy s� okre�lone w okre�lony spos�b. "

Rozszerzone sieci przej�ciowe

Wiele os�b zda�o sobie spraw�, �e gramatyki bezkontekstowe (takie jak te, kt�re om�wi�em wcze�niej) by�y zbyt s�abe do wi�kszo�ci praktycznych aplikacji do przetwarzania j�zyka naturalnego. Na przyk�ad, gdyby�my rozszerzyli gramatyk� ilustracyjn�, tak aby obejmowa�a (opr�cz "rzucania" i "uderzania" i "cz�owieka") czasowniki tera�niejsze "rzut", "rzuty" i "uderza" i rzeczownik w liczbie mnogiej "m�czy�ni", w�wczas sznurki "m�czy�ni uderzaj� pi�k�" i "cz�owiek rzuca pi�k�" by�yby niew�a�ciwie przyj�te jako zdania gramatyczne. Aby rozszerzy� gramatyk� bezkontekstow�, wymagaj�c, �e rzeczowniki i czasowniki musz� si� zgadza� co do liczby wymaga�oby niepraktycznie du�ego zbioru zasad. Ponadto uwzgl�dnienie zda� pasywnych, takich jak "pi�ka zosta�a trafiona przez m�czyzn", wymaga�oby jeszcze dalszego dopracowania. Najwyra�niej tego rodzaju zdania, kt�re geolodzy mogliby zada� na temat ska� ksi�ycowych, wymaga�y silniejszych gramatyk -takich jak rozbudowane sieci przej�ciowe, kt�re Woods i inni opracowali. W ksi��ce Chomsky'ego z 1957 roku zaproponowa� hierarchi� system�w gramatycznych, kt�rych gramatyki bezkontekstowe by�y tylko jednym przyk�adem. Jego pot�niejsze gramatyki mia�y "komponent transformacyjny" i by�y w stanie, na przyk�ad, aby przeanalizowa� zdanie takie jak "pi�ka zosta�a trafiona przez m�czyzn�" i nada� mu tak� sam� "g��bok� struktur�", jak w przypadku zdania "m�czyzna uderzy� pi�k�". Rozszerzone gramatyki sieci przej�ciowej mog� r�wnie� wykonywa� tego rodzaju transformacje, ale w spos�b bardziej satysfakcjonuj�cy obliczeniowo. Rozszerzona sie� przej�ciowa jest podobn� do mapy struktur� graficzn�, w kt�rej w�z�y reprezentuj� punkty post�pu w procesie analizowania, a �cie�ki ��cz�ce dwa w�z�y reprezentuj� kategorie sk�adniowe. Mo�emy my�le� o analizowaniu zdania jako przemierzaniu �cie�ki przez sie� od w�z�a pocz�tkowego (brak post�p�w) do w�z�a ko�cowego (gdzie zdanie zosta�o pomy�lnie przetworzone). Przemierzanie �cie�ki buduje struktur� sk�adniow� zdania w postaci drzewa parsowania. Analiza zdania polega na odrywaniu s��w od lewej do prawej i u�yciu ich do wskazania �cie�ki w sieci. Analiza syntaktyczna mo�e rozpocz�� si� od oderwania pojedynczego s�owa i wyszukania z leksykonu, czy jest to rzeczownik, okre�lnik, pomocnik (taki jak "robi"), przymiotnik lub inna "ko�cowa" kategoria sk�adniowa. Lub mo�e zacz�� od oderwania grupy s��w i sprawdzenia, czy ta grupa by�a fraz� rzeczownikow�, fraz� czasownikow�, fraz� przyimkow� lub czym� innym. W pierwszym przypadku, w zale�no�ci od kategorii pojedynczego s�owa, wybraliby�my �cie�k� odpowiadaj�c� tej kategorii prowadz�cej z w�z�a pocz�tkowego. Aby uwzgl�dni� drugi przypadek, istnia�yby mo�liwe �cie�ki odpowiadaj�ce wyra�eniu rzeczownikowi i innym mo�liwym kategoriom sk�adniowym wy�szego poziomu. Ale jak zdecydowaliby�my, na przyk�ad, czy mo�emy podj�� cie�k� rzeczownikow�? Woods i inni zaproponowali odpowied�, �e b�d� istnia�y dodatkowe sieci przej�ciowe odpowiadaj�ce tym kategoriom wy�szego poziomu. Mogliby�my obra� �cie�k� rzeczownikow� w g��wnej sieci przej�ciowej tylko wtedy, gdyby�my mogli pomy�lnie przej�� przez sie� rzeczownikow�. A poniewa� jedna �cie�ka w sieci wyra�e� rzeczownikowych mo�e zaczyna� si� od wyra�enia przyimkowego, musieliby�my sprawdzi�, czy mogliby�my pod��a� t� �cie�k� (w sieci wyra�e� rzeczownikowych), pomy�lnie przechodz�c przez sie� wyra�e� przyimkowych. Proces ten by�by kontynuowany, gdy jedna sie� "dzwoni" do innych sieci w spos�b podobny do tego, w jaki program mo�e ponownie uruchomi� (lub "wywo�a�") inne programy, by� mo�e rekurencyjnie. Z tego powodu takie sieci s� nazywane rekurencyjnymi sieciami przej�ciowymi. Pierwsze sieci tego rodzaju opracowali James Thorne, Paul Bratley i Hamish Dewar na University of Edinburgh w Szkocji. P�niej Dan Bobrow i Bruce Fraser zaproponowali system sieci przej�ciowej . Oba te systemy wykona�y r�wnie� obliczenia pomocnicze podczas przechodzenia przez swoje sieci. Te "rozszerzenia" pozwoli�y na zbudowanie "g��bokiej struktury" reprezentacji analizowanego zdania. Praca Woodsa nad "rozszerzonymi, rekurencyjnymi sieciami przej�ciowymi" opiera�a si� na tych ideach i wprowadza�a do nich elegancki j�zyk definicji sieci. Jako przyk�ad Woods opisa�, jak jedna z jego sieci przeanalizowa�a zdanie "Uwa�ano, �e John zosta� zastrzelony". Po wykonaniu wszystkich po��cze� do sieci pomocniczych i wszystkich oblicze� pomocniczych uzyskano drzewo analizy przedstawione poni�ej

Mo�emy obserwowa� dwie rzeczy dotycz�ce tego drzewa analizy. Najpierw zwr�� uwag� na wyst�powanie "PAST" i "PAST PERFECT" jako znacznik�w czasu. Po drugie, zauwa�, �e forma oryginalnego zdania z pasywnym g�osem zosta�a przekszta�cona w zdanie z aktywnym g�osem, u�ywaj�c przypuszczalnego zaimka "Kto�". Jak zauwa�a Woods, struktur� mo�na sparafrazowa� jako "Kto� uwierzy�, �e kto� zastrzeli� Johna". Gramatyki sieciowe uzyskuj� "g��bok� struktur�" zda�, przekszta�caj�c je nast�pnie w standardow� form�.

GUS

Dan Bobrow i Ronald Kaplan, dwaj naukowcy wykonuj�cy prac� NLP w BBN, przeprowadzili si� do nowo utworzonego Centrum Badawczego Palo Alto (PARC) w Xerox w po�owie lat 70. XX wieku. Jednym z projekt�w, nad kt�rymi pracowali tam oni i inni badacze, by� GUS (akronim Genial Understander System), kt�ry mia� "anga�owa� sympatycznego i wysoce wsp�pracuj�cego cz�owieka w angielski dialog, ukierunkowany na konkretny cel w bardzo ograniczonym zakresie dziedzina dyskursu ". Ograniczon� domen� by�a agencja turystyczna prowadz�ca "rozmow� z klientem, kt�ry chce odby� prost� podr� powrotn� do jednego miasta w Kalifornii". Poni�sza transkrypcja rzeczywistego okna dialogowego pokazuje niekt�re z jej umiej�tno�ci:

GUS: Cze��. Mam na imi� GUS. Mog� pom�c Ci zaplanowa� prost� podr� samolotem. Gdzie chcesz jecha�?
(1) Klient: Chc� jecha� do San Diego 28 maja.
GUS: O kt�rej chcesz wyj��?
(2) Klient: Musz� by� w San Diego przed 10 rano.
GUS: Czy chcia�by� P.S.A. czy 102, kt�ra przyje�d�a o godz. 9.15?
(3) Klient: jaki jest nast�pny lot?
GUS: Air California 310, kt�ry odje�d�a o godz. 8.30 i przyje�d�a o godz. 10.00.
(4) Klient: wezm� pierwszy.
GUS: W czyim imieniu powinienem dokona� rezerwacji?
(5) Klient: Dan Bobrow.
GUS: Zatwierdzi�em nast�puj�c� walk�: P.SA. lot 102 w �rod� 28 maja z San Jose do San Diego, kt�ry odje�d�a o godz. 7.30 i przybywa o godz. 9.15. Kiedy chcesz wr�ci�?
(6) Klient: w pi�tek wieczorem.
GUS: Czy chcia�by� lot, kt�ry wyjdzie o 19:45?
(7) Klient: �wietnie
GUS: Zatwierdzi�em nast�puj�cy lot: P.S.A. lot 307 w pi�tek 30 maja z San Diego do San Jose, kt�ry wylatuje o 19:45 i przylatuje o 21.30. Dzi�ki, �e zadzwoni�e�. Do widzenia.

Chocia� mo�liwo�ci systemu by�y z pewno�ci� ograniczone, GUS by� w stanie poradzi� sobie z wieloma problemami. Jeden z nich dotyczy tego, co badacze NLP nazywaj� "rozwi�zywaniem anafory", przez co rozumiej� obiekty lub zdarzenia, do kt�rych odnosz� si� r�ne s�owa lub frazy w oknie dialogowym. Kilka przyk�ad�w, wpisanych w zdania numerowane w powy�szym oknie dialogowym, wymieniono w artykule o GUS. Na przyk�ad w wierszu (3) zapytanie klienta odnosi si� do k��tni wspomnianych w wypowiedzi GUS bezpo�rednio poprzedzaj�cej. W (4) jest odniesienie do walki wspomnianej wcze�niej w rozmowie, [po linii (2)]. Zauwa�, �e "nast�pna walka" w (3) mia�a by� interpretowana w odniesieniu do kolejno�ci walk w przewodniku linii lotniczych, podczas gdy "pierwsza" w (4) odnosi si� do kolejno�ci, w jakiej wspomniane by�y walki. Kolejne ukryte odniesienie le�y u podstaw u�ycia "pi�tku" do okre�lenia daty w (6). Rozwi�zanie tego odniesienia wymaga skomplikowanego uzasadnienia obejmuj�cego zar�wno tre��, jak i kontekst rozmowy. Poniewa� 28 maja podano jako dat� wyjazdu, klient prawdopodobnie musi by� w nast�pny pi�tek. Z drugiej strony za��my, �e specyfikacje zosta�y odwr�cone, a pi�tek podano jako dat� wyjazdu w wierszu (1). By�oby to wtedy naj�atwiejsze do zinterpretowania jako odnosz�ce si� do pi�tku bezpo�rednio po rozmowie. GUS by� kombinacj� kilku komunikuj�cych si� podsystem�w, a analizator morfologiczny do radzenia sobie ze sk�adnikami s��w, analizator sk�adniowy do generowania drzew parsowanych, "uzasadnienie" pozwalaj�ce pozna� znaczenie i intencje u�ytkownika oraz generator j�zyka odpowiadaj�cy. Kontrolowanie tych komponent�w odbywa�o si� za pomoc� mechanizmu "porz�dku obrad". Jak wyja�niaj� autorzy, GUS dzia�a w cyklu, w kt�rym analizuje ten program, wybiera nast�pne zadanie do wykonania i robi to. Zasadniczo wykonanie wybranego zadania powoduje, �e wpisy dotycz�ce nowych zada� s� tworzone i umieszczane w porz�dku obrad. Generowanie tekstu wyj�ciowego mo�na w dowolnym momencie wywo�a� za pomoc� proces�w wnioskowania, a dane wej�ciowe od klienta s� obs�ugiwane za ka�dym razem, gdy si� pojawi�. S� miejsca, w kt�rych informacje z p�niejszego etapu (na przyk�ad dotycz�ce semantyki) s� przekazywane z powrotem do wcze�niejszego etapu ( takich jak parser). Proces nadzorczy mo�e zmieni� porz�dek obrad w dowolnym momencie. Sk�adniowy sk�adnik GUS mia� "dost�p do g��wnego s�ownika zawieraj�cego ponad 3000 rdzeni i prostych idiom�w". Analizator sk�adniowy zosta� oparty na systemie opracowanym wcze�niej przez Ronalda Kaplana, kt�ry wykorzystywa� gramatyk� sieci przej�ciowej i zosta� nazwany "Og�lnym procesorem syntaktycznym". Zdania klient�w zosta�y zakodowane w "ramkach" (kt�re s� zwi�zane z ramkami Minsky′ego, ale bli�ej w formie sieci semantycznych). Niekt�re ramki opisuj� sekwencj� normalnego dialogu, podczas gdy inne przedstawiaj� atrybuty daty, planu podr�y lub podr�ny. Sk�adnik wnioskowania GUS wykorzysta� zawarto�� i struktur� ramek, aby wydedukowa�, jak najlepiej interpretowa� zdania klient�w .Opr�cz anafory w dokumencie wspomniano o kilku innych problemach, z kt�rymi GUS by� w stanie poradzi� sobie. Ostrzeg� jednak r�wnie�, �e "o wiele �atwiej jest ekstrapolowa� z [przyk�adowego okna dialogowego] b��dne przekonanie, �e GUS zawiera rozwi�zania znacznie wi�kszej liczby problem�w ni� mia�o to miejsce". Przyk�adowe dialogi zarejestrowane mi�dzy ludzkimi klientami a lud�mi odgrywaj�cymi rol� GUS ujawni�y liczne przypadki awarii komputera GUS. Autorzy doszli do wniosku, �e je�li u�ytkownicy system�w takich jak GUS odst�pi� "od zachowania, kt�rego si� od nich oczekuj� w najdrobniejszych szczeg�ach, lub je�li pozornie nieznaczne zmiany zostan� wprowadzone do struktury a systemy dzia�a�yby tak, jakby mia�y "ra��c� afazj�"lub po prostu umar�y. Autorzy przyznali, �e" sam GUS nie jest bardzo inteligentny, ale ilustruje to, co uwa�amy za niezb�dne elementy [rozumienia j�zyka inteligentnego ] system… [Musi mie� wysokiej jako�ci analizator sk�adni, komponent uzasadnienia i dobrze ustrukturyzowan� baz� wiedzy. "Kolejne prace nad NLP w PARC i wielu innych miejscach mia�y na celu ulepszenie wszystkich tych komponent�w. Systemy opracowane przez badaczy takich jak Winograd , Woods, Bobrow i ich koledzy byli bardzo imponuj�cymi krokami w kierunku konwersacji z komputerami w j�zyku angielskim, ale wci�� by�o wiele do zrobienia, zanim systemy rozumienia j�zyka naturalnego b�d� mog�y dzia�a� w spos�b przewidziany przez Winograda we wst�pie do jego doktoratu. rozprawa: wyobra�my sobie nowy spos�b korzystania z komputer�w, aby mogli oni przyjmowa� instrukcje w spos�b odpowiadaj�cy ich pracy. Porozmawiamy z nimi tak, jak rozmawiamy z asystentem naukowym, bibliotekarzem lub sekretark�, a oni przeprowadz� nasze polecenia i przeka� nam informacje, o kt�re prosimy. Je�li nasze instrukcje nie b�d� wystarczaj�co jasne, poprosz� o nie

Historia Sztucznej InteligencjiArtificial Intelligence Experts

Post�p w NLP