Przetwarzanie J�zyka Naturalnego

Poza rozpoznawaniem wzor�w pojedynczych znak�w alfanumerycznych, niezale�nie od tego, czy s� one czcionk� sta�� czy odr�cznie, le�y problem zrozumienia ci�g�w znak�w tworz�cych s�owa, zdania lub wi�ksze zespo�y tekstu w "naturalnym" j�zyku, takim jak angielski. Aby odr�ni� j�zyki takie jak angielski od j�zyk�w u�ywanych przez komputery, te pierwsze s� zwykle nazywane "j�zykami naturalnymi". W sztucznej inteligencji "rozumienie" danych wej�ciowych w j�zyku naturalnym zwykle oznacza albo konwersj� do pewnego rodzaju modelu pami�ci (takiego jak ten u�ywany przez Rafaela w jego systemie SIR lub sie� semantyczna wykorzystywana przez Quilliana) lub wywo�anie pewnych dzia�a� odpowiednich dla wej�cie. J�zyki naturalne s� m�wione i pisane. A poniewa� d�wi�ki mowy nie s� tak dobrze podzielone na segmenty, jak znaki drukowane na stronie, rozumienie mowy przedstawia dodatkowe trudno�ci. Odwrotno�ci� rozumienia j�zyka naturalnego jest generowanie j�zyka naturalnego - zar�wno w mowie, jak i pi�mie. T�umaczenie z jednego j�zyka na inny dotyczy zar�wno zrozumienia, jak i generacji. Podobnie jest z kontynuowaniem rozmowy. Wszystkie te problemy (rozumienie, generowanie, t�umaczenie i konwersacja) nale�� do og�lnej nazwy "przetwarzanie j�zyka naturalnego" (czasami w skr�cie NLP).

Poziomy j�zykowe

Lingwi�ci i inni ucz�cy si� j�zyka rozpoznaj� kilka poziom�w, na kt�rych mo�na analizowa� j�zyk. Poziomy te mo�na u�o�y� w pewnego rodzaju hierarchi�, zaczynaj�c od tych, kt�re dotycz� najbardziej podstawowych sk�adnik�w j�zyka (d�wi�k�w i cz�ci s��w) i przechodz�c w g�r� do poziom�w zajmuj�cych si� sekwencjami zda�. Je�li mowa jest o mowie, istniej� poziomy fonetyki (d�wi�ki j�zykowe) i fonologii (organizacja d�wi�k�w w s�owa). Zar�wno w mowie, jak i tek�cie, morfologia zajmuje si� sposobem ��czenia ca�ych s��w z mniejszych cz�ci. Na przyk�ad "chodzenie" sk�ada si� z "chodzenia" plus "-ing". Nast�pnie sk�adnia dotyczy struktury zda� i gramatyki. Pr�buje opisa� zasady, wed�ug kt�rych ci�g s��w w okre�lonym j�zyku mo�e by� oznaczony gramatycznie lub nie. Na przyk�ad ci�g "John uderzy� pi�k�" jest gramatyczny, ale ci�g "pi�ka uderzy� Jana" nie. Wraz ze s�ownikowymi definicjami s��w najwa�niejsza jest sk�adnia dla zrozumienia znaczenia zdania. Na przyk�ad zdanie "Jan widzia� cz�owieka z teleskopem" ma dwa r�ne znaczenia w zale�no�ci od struktury sk�adniowej (to znaczy, w zale�no�ci od tego, czy "za pomoc� teleskopu" odnosi si� do "cz�owieka", kt�ry mia� teleskop, czy do "zobaczy� "). Jednak sama gramatyka nie wystarcza do okre�lenia znaczenia. Na przyk�ad zdanie "Bezbarwne zielone pomys�y �pi� w�ciekle" mo�e by� uwa�ane za gramatyczne, ale jest to nonsensowny. Poziom semantyki pomaga okre�li� znaczenie (lub bezsensowno��) zdania poprzez zastosowanie analiz logicznych. Na przyk�ad poprzez analiz� semantyczn� "idea" nie mo�e by� jednocze�nie "bezbarwny" i "zielony". Nast�pnie pojawia si� poziom pragmatyki, kt�ry uwzgl�dnia kontekst zdania, aby okre�li� znaczenie. Na przyk�ad "John poszed� do banku" mia�by inne znaczenie w zdaniu o shing streamie ni� w zdaniu o handlu. Pragmatyka zajmuje si� znaczeniami w kontek�cie konkretnych sytuacji. Jeden z tych poziom�w, a mianowicie sk�adnia, by� przedmiotem wielu wczesnych bada� i nadal jest wa�nym aspektem NLP. W 1957 r. Lingwista ameryka�ski Noam Chomsky opublikowa� prze�omow� ksi��k� zatytu�owan� "Struktury syntaktyczne", w kt�rej zaproponowa� zestawy regu� gramatycznych, kt�re mo�na by wykorzysta� do generowania "legalnych" zda� w j�zyku. Te same zasady mo�na r�wnie� zastosowa� do analizy ci�gu s��w w celu ustalenia, czy utworzy�y one prawny wyrok w danym j�zyku. Zilustruj� spos�b przeprowadzania tej analizy przy u�yciu tego, co Chomsky nazwa� gramatyk� struktury fraz (PSG). Proces ten jest bardzo podobny do tego, w jaki spos�b wszyscy powtarzali�my zdania w szkole podstawowej. Gramatyki definiuje si�, okre�laj�c zasady zast�powania s��w w �a�cuchu symbolami odpowiadaj�cymi kategoriom sk�adniowym, takim jak rzeczownik, czasownik lub przymiotnik. Gramatyki maj� r�wnie� zasady zast�powania ci�g�w tych symboli sk�adniowych dodatkowymi symbolami. Aby zilustrowa� te idee, u�yj� bardzo prostej gramatyki, dostosowanej do jednego z przyk�ad�w Chomsky'ego. Ta gramatyka ma tylko trzy kategorie sk�adniowe: okre�lnik, rzeczownik i czasownik. Te trzy elementy s� wystarczaj�ce do analizy ci�g�w, takich jak "cz�owiek uderzy� pi�k�". Jedna z zasad w tej ilustracyjnej gramatyce m�wi, �e mo�emy zast�pi� jedno ze s��w "the" lub "a" symbolem "DET" (dla okre�lenia Lingwi�ci pisz� t� zasad� w nast�puj�cy spos�b:

the | a → DET

(Symbol | s�u�y do wskazania, �e kt�rekolwiek z otaczaj�cych go s��w mo�na zast�pi� sk�adniowym symbolem po prawej stronie strza�ki.) Oto kilka innych zasad, napisanych w tym samym formacie:

man | ball | John → N.

(S�owa "man", "ball" i "John" mo�na zast�pi� symbolem "N "dla rzeczownika.)

hit | took | throw → V.

(S�owa "hit, "took" i "throw "mo�na zast�pi� symbolem "V "dla czasownika.)

DET N → NP

(Ci�g symboli "DET "i " N" mo�na zast�pi� symbolem "NP "dla frazy rzeczownik.)

V NP. → VP

(Ci�g symboli "V "i "NP" mo�na zast�pi� symbolem "VP "dla frazy czasownika).

NP VP → S.

(Ci�g symboli "NP "i "VP" mo�na zast�pi� symbolem "S "za zdanie.)

Symbole takie jak "S, "DET," "NP, i tak dalej nazywane s� "nieterminalnymi" symbolami j�zyka okre�lonego przez gramatyk�, podczas gdy s�owa s�ownictwa takie jak "ball, "john" i "throw "s� symbolami "terminala" j�zyka. Mo�emy zastosowa� te regu�y do �a�cucha "cz�owiek uderzy� pi�k�", aby przekszta�ci� go w "S." M�wi si�, �e ka�dy �a�cuch, kt�ry mo�na zmieni� w "S "w ten spos�b b�d� gramatyczny {prawny wyrok w j�zyku okre�lonym przez t� bardzo prost� gramatyk�. Jednym ze sposob�w zilustrowania aplikacji regu�, zwanych drzewem analizy, jest pokazane na poni�ej

Ten przyk�ad zosta� oparty na ma�ym zestawie kategorii sk�adniowych i zasady zast�powania, aby zilustrowa� g��wne pomys�y dotycz�ce analizy sk�adniowej. Aby gramatyka by�a nieco bardziej realistyczna, musieliby�my uwzgl�dni� symbole i regu�y zast�pcze dla przymiotnik�w, przys��wk�w, przyimk�w i tak dalej. I oczywi�cie musieliby�my uwzgl�dni� o wiele wi�cej s��w s�ownych. Gramatyki nazywane s� gramatykami bezkontekstowymi (CFG), je�li wszystkie ich regu�y maj� tylko jeden nieterminalny symbol po prawej stronie strza�ki. Nazywa si� to tak, poniewa� gdy regu�y s� u�ywane w odwrotnej kolejno�ci (zamiast generowa�, a nie analizowa� zdania gramatyczne), spos�b, w jaki symbol nieterminalny jest zast�piony nie zale�y od obecno�ci jakichkolwiek innych symboli. PSG s� pozbawione kontekstu. Schemat poni�szy pokazuje, jak regu�y naszej prostej gramatyki mo�na wykorzysta� do generowania zda�. W tym przypadku zaczyna si� od symbolu zdania, a mianowicie "S" i generuje zdanie "John rzuci� pi�k�."

Ta prosta gramatyka z pewno�ci� nie mo�e wygenerowa� wszystkich zda�, kt�re, jak twierdzimy, �e jest legalny lub akceptowalny. Generuje tak�e zdania, kt�rych normalnie nie chcieliby�my zaakceptowa�, na przyk�ad: "John rzuci� pi�k�". Ksi��ka Chomsky′ego prezentuje znacznie bardziej z�o�one gramatyki, a p�niej powsta�y do�� skomplikowane gramatyki. Na pocz�tku lat 60. XX wieku zakodowano kilka gramatyk w programach komputerowych, kt�re potrafi� parsowa� pr�bki tekstu w j�zyku angielskim. Niemniej jednak nawet najbardziej z�o�one gramatyki nie mog� czysto rozr�nia� zdania, kt�re uznaliby�my za poprawne gramatycznie, od tych, kt�rych by�my nie zaakceptowali. Spos�b, w jaki zdanie jest analizowane przez gramatyk�, mo�e determinowa� jego znaczenie, dlatego wa�n� cz�ci� przetwarzania j�zyka naturalnego jest u�ycie regu� gramatyki w celu znalezienia akceptowalnych drzew parsowania zda�. Znalezienie drzewa analizy wymaga wyszukiwania - na kilka r�nych sposob�w, w jakie nieterminalne symbole, zaczynaj�ce si� na "S", mo�na zast�pi� za pomoc� regu� gramatycznych, pr�buj�c dopasowa� zdanie docelowe lub na kilka r�nych sposob�w s�owa w zdaniu docelowym mo�na zast�pi� nieterminalnymi symbolami w celu uzyskania symbolu "S." Pierwsze z tych wyszukiwa� nosi nazw� "z g�ry na d�" (od "S" do zdania); drugie nazywa si� "z do�u do g�ry" (od zdania do "S"). Cz�sto (je�li nie zwykle) zdarza si�, �e z uwagi na gramatyk� zdania mog� mie� wi�cej ni� jedno drzewo analizy, ka�de o innym znaczeniu. Na przyk�ad "m�czyzna uderzy� pi�k� w parku" mo�e mie� drzewo parsowania, w kt�rym "w parku" jest cz�ci� frazy czasownika wraz z "uderzeniem" lub parsowanie drzewa, w kt�rym "w parku" jest cz�ci� fraza rzeczownikowa wraz z "pi�k�". Co wi�cej, jak ju� wspomnia�em, niekt�re fragmenty zda� mog� by� bez znaczenia. Na przyk�ad, zgodnie z moj� prost� gramatyk�, "pi�ka rzuci�a cz�owieka" to zdanie legalne, ale prawdopodobnie bez znaczenia. Decyzja o tym, kt�re drzewo analizy jest odpowiednie, jest cz�ci� procesu decydowania o znaczeniu i jest zadaniem dla semantyki (a by� mo�e nawet poziom pragmatyki). Pod koniec lat pi��dziesi�tych i przez wi�kszo�� lat sze��dziesi�tych i p�niej analiza syntaktyczna by�a bardziej rozwini�ta ni� semantyka. Analiza semantyczna zwykle polega na u�yciu drzewa parsowania do kierowania transformacj� zdania wej�ciowego w wyra�enie w jakiej� studni -de ned "j�zyk reprezentuj�cy znaczenie" lub program, kt�ry odpowiednio reaguje na zdanie wej�ciowe. Na przyk�ad "m�czyzna rzuci� pi�k�" mo�e zosta� przekszta�cony w wyra�enie logiczne, takie jak

kt�re mo�na zinterpretowa� jako "istniej� x, y i z , tak �e z jest zdarzeniem, kt�re mia�o miejsce w przesz�o�ci, x jest m�czyzn� w tym zdarzeniu, y jest pi�k� w tym zdarzeniu, a x rzuca y w tym zdarzeniu .Analiza semantyczna mo�e r�wnie� przekszta�ci� zdanie "m�czyzna rzuci� pi�k�" w program, kt�ry w pewien spos�b symuluje rzucanie pi�k� w przesz�o�ci.

T�umaczenie maszynowe

Niekt�re z pierwszych pr�b wykorzystania komputer�w do wykonywania wi�cej ni� zwyk�ych oblicze� numerycznych polega�y na automatycznym t�umaczeniu zda� z jednego j�zyka na zdania z drugiego. S�owniki s�owne mog� by� przechowywane w pami�ci komputera (na ta�mach lub na perforowanych kartach) i mog� by� u�yte do znalezienia angielskich odpowiednik�w dla obcych s��w. Uwa�ano, �e wybranie odpowiedniego odpowiednika dla ka�dego obcego s�owa w zdaniu, wraz z niewielk� ilo�ci� analizy sk�adniowej, mo�e zosta� wykorzystane do przet�umaczenia zdania na obcy j�zyk (na przyk�ad z rosyjskiego) na angielski. Raportuj�c o nowym komputerze opracowywanym przez zesp� prowadzony przez Harry′ego D. Huskeya w National Bureau of Standards (obecnie nazywanym National Institute of Standards and Technology), New York Times poinformowa� 31 maja 1949 r :

"rodzaj maszyny obliczeniowej "elektryczny m�zg", zdolnej nie tylko do wykonywania skomplikowanych problem�w matematycznych, ale nawet do t�umaczenia j�zyk�w obcych, jest w trakcie budowy w Bureau of Standards Laboratory w University of California's Institute of Numerical Analysis. Maszyna nie b�dzie w polu t�umaczenia ,nie zosta�a podj�ta, naukowcy pracuj�cy nad ni� twierdz�, �e by�oby ca�kiem mo�liwe, aby obejmowa�a ona 60 000 s��w z Webster Collegiate Dictionary z odpowiednikami dla ka�dego s�owa w a� trzech j�zykach obcych. urz�dzenie mo�e wykona� t�umaczenie, napisa� reporter "Timesa", gdy obce s�owo do t�umaczenia jest wprowadzane do maszyny w formie elektro symbol matematyczny na ta�mie lub karcie, urz�dzenie przejdzie przez swoj� "pami�� ", a je�li uzna ten symbol za rekord, automatycznie wyemituje z g�ry okre�lony odpowiednik -angielskie s�owo.…"

Wprawdzie b�dzie to prymitywne t�umaczenie s�owo w s�owo, pozbawione sk�adni, ale mimo to b�dzie niezwykle cenne, projektanci twierdz�, �e do takich cel�w, jak t�umaczenia zagranicznych prac technicznych przez naukowc�w, w kt�rych s�ownictwo jest znacznie wi�kszym problemem ni� sk�adnia. Maszyna w rzeczywisto�ci nie wykona�a �adnych t�umacze� - pomys� zrobienia tego by� nadal tylko mo�liwo�ci� przewidzian� przez Huskey′a. Ale nawet nienaukowcy mogliby sobie wyobrazi� trudno�ci. Artyku� wst�pny w "New York Times" nast�pnego dnia dobrze przedstawi� problem:

"mamy w�tpliwo�ci co do dok�adno�ci ka�dego t�umaczenia. Jak maszyna decyduje, czy francuskie s�owo "pont" ma by� t�umaczone jako "most" lub "pok�ad", czy wiedzie�, �e "operacja" w j�zyku niemieckim oznacza operacj� chirurgiczn�? Wszystko, co maszyna mo�e zrobi�, to upro�ci� zadanie wyszukiwania s��w w s�owniku i ustawiania ich angielskich odpowiednik�w na ta�mie, tak aby t�umacz wci�� musia� oprawi� odpowiednie zdania i nada� s�owom znaczenie kontekstowe."

W li�cie do Norberta Wienera z 1947 r. Warren Weaver, matematyk i administrator nauki, wspomnia� o mo�liwo�ci wykorzystania komputer�w cyfrowych do t�umaczenia dokument�w mi�dzy naturalnymi ludzkimi j�zykami. Wiener w�tpi� w t� mo�liwo��. W odpowiedzi dla Weavera Wiener napisa�:

"Szczerze m�wi�c, obawiam si�, �e granice s��w w r�nych j�zykach s� zbyt niejasne, a konotacje emocjonalne i mi�dzynarodowe s� zbyt rozleg�e, aby jakikolwiek quasi-mechaniczny schemat t�umaczenia by� bardzo obiecuj�cy".

Niemniej jednak do lipca 1949 r. Weaver opracowa� swoje pomys�y w memorandum zatytu�owanym "T�umaczenie", kt�re przes�a� kilku kolegom. Weaver rozpocz�� swoj� notatk� od stwierdzenia, co nast�puje:

"Nie trzeba nic wi�cej robi� ni� wspomnie� o oczywistym fakcie, �e r�norodno�� j�zyk�w utrudnia kulturow� wymian� mi�dzy ludami ziemi i stanowi powa�ny czynnik odstraszaj�cy od mi�dzynarodowego zrozumienia. Niniejsze memorandum, zak�adaj�ce wa�no�� i znaczenie tego faktu, zawiera kilka uwag i sugestii dotycz�cych mo�liwo�ci wniesienia przynajmniej cz�ciowego rozwi�zania problemu t�umaczenia na ca�ym �wiecie za pomoc� komputer�w elektronicznych o du�ej pojemno�ci, elastyczno�ci i pr�dko��."

Wed�ug redaktor�w opublikowanego tomu, w kt�rym memorandum zosta�o przedrukowane,

"kiedy wys�a� go do oko�o 200 swoich znajomych w r�nych krajach, by�a to dos�ownie pierwsza sugestia, �e wi�kszo�� kiedykolwiek widzia�a, �e t�umaczenie j�zyka za pomoc� technik komputerowych jest mo�liwe. "

Dokumentowi Weavera cz�sto przypisuje si� zainicjowanie pola t�umaczenia maszynowego (cz�sto w skr�cie MT). W czerwcu 1952 r. W MIT Yehoshua Bar-Hillel, izraelski logik, kt�ry by� w�wczas w Laboratorium Badawczym ds. Elektroniki MIT, zorganizowa� pierwsz� konferencj� po�wi�con� t�umaczeniu maszynowemu. Pocz�tkowo optymistycznie nastawiony do mo�liwo�ci, Bar-Hillel doszed� do wniosku, �e pe�ne automatyczne t�umaczenie jest niemo�liwe. W styczniu 1954 r. W g��wnej siedzibie IBM World przy 57th Street i Madison Avenue w Nowym Jorku zademonstrowano automatyczne t�umaczenie pr�bek rosyjskiego tekstu na angielski. Demonstracja, przy u�yciu ma�ego s�ownictwa i ograniczonej gramatyki, by�a wynikiem wsp�pracy mi�dzy IBM a Georgetown University. Projektem kierowali Cuthbert Hurd, dyrektor Departamentu Nauk Stosowanych w IBM i Lonon Dostert z Georgetown. Wed�ug komunikatu prasowego IBM 10 z 8 stycznia 1954 r. rosyjski zosta� po raz pierwszy przet�umaczony na angielski przez "m�zg". Kr�tkie wypowiedzi na temat polityki, prawa, matematyki, chemii, metalurgii, komunikacji i spraw wojskowych zosta�y przekazane w j�zyku rosyjskim przez lingwist�w z Georgetown University Institute of Languages and Linguistics do s�ynnego komputera 701 International Business Machines Corporation. A gigantyczny komputer w ci�gu kilku sekund przekszta�ci� zdania w czytelny angielski. Dziewczyna, kt�ra nie rozumia�a ani s�owa j�zyka Sowiet�w, wyrzuci�a rosyjskie wiadomo�ci na kartach IBM. "M�zg" wys�a� swoje angielskie t�umaczenia na automatycznej drukarce z zawrotn� pr�dko�ci� dw�ch i p� linii na sekund�.

"Mi pyeryedayem mislyi posryedstvom ryechyi", w[pisa�a dziewczyna.

A 701 odpowiedzia�:

" Przekazujemy my�li za pomoc� Mowa."

Chocia� demonstracja wywo�a�a wiele emocji i doprowadzi�a do zwi�kszenia funduszy na badania nad t�umaczeniem, p�niejsze prace w terenie by�y rozczarowuj�ce. Po ocenie pracy MT w opublikowanym raporcie z 1959 r. w�r�d badaczy, Bar-Hillel przekona� si�, �e w pe�ni automatyczne t�umaczenie wysokiej jako�ci (kt�re nazwa� FAHQT) nie by�o mo�liwe "nie tylko w niedalekiej przysz�o�ci, ale w og�le". Jego rozszerzony raport ukaza� si� w artykule z 1960 r., kt�ry cieszy� si� szerokim rozpowszechnieniem. Jednym z czynnik�w prowadz�cych Bar-Hillela do jego negatywnych wniosk�w by�a widoczna trudno�� w zapewnieniu komputerom "wiedzy o �wiecie" potrzebnej do t�umaczenia wysokiej jako�ci. Zilustrowa� problem nast�puj�c� histori�:

Ma�y John szuka� swojego pude�ka z zabawkami. W ko�cu go znalaz�. Pude�ko by�o w pi�rze. John by� bardzo szcz�liwy. Jak t�umaczy� "Pude�ko by�o we pi�rze"? Bar-Hillel argumentowa�, �e nawet gdyby istnia�y tylko dwie definicje "pi�ra" (przybory do pisania i obudowa, w kt�rej bawi� si� ma�e dzieci), komputer znaj�cy tylko te definicje nie by�by w stanie zdecydowa�, kt�re znaczenie jest zamierzone. Opr�cz znajomo�ci s�ownictwa i sk�adni komputer t�umacz�cy musia�by zna� "wzgl�dne rozmiary pi�r w sensie pisania narz�dzia, pude�ka z zabawkami i d�ugopisy, w sensie kojc�w" .T� wiedz�, jak twierdzi� Bar-Hillel, nie dysponowa� komputer elektroniczny. Powiedzia�, �e przekazanie komputerowi takiej encyklopedycznej wiedzy jest" ca�kowicie chimeryczne i prawie na nic nie zas�uguje dalsza dyskusja".

Jak p�niej przyznali p�niej naukowcy, Bar-Hillel mia� racj� co do tego, �e wysoce kompetentne systemy przetwarzania j�zyka naturalnego (a w�a�ciwie og�lnie rzecz bior�c, og�lnie wszechstronne systemy sztucznej inteligencji) b�d� musia�y posiada� wiedz� encyklopedyczn�. Jednak wi�kszo�� badaczy AI nie zgadza si� z nim co do bezcelowo�ci pr�by przekazania komputerom wymaganej wiedzy encyklopedycznej. Bar-Hillel by� znany z tego, �e by� troch� niemi�y w kwestii sztucznej inteligencji. (Komentuj�c artyku� Johna McCarthy′ego "Programy ze zdrowym rozs�dkiem" na konferencji w Teddington w 1958 r., Bar-Hillel powiedzia�: "Artyku� dr McCarthy′ego nale�y do Journal of Half-Baked Ideas, kt�rego stworzenie niedawno zaproponowa� dr IJ Good. ")

W kwietniu 1964 r. Narodowa Akademia Nauk utworzy�a Komitet Doradczy ds. Automatycznego Przetwarzania J�zyk�w (ALPAC), kt�rego przewodnicz�cym by� John R. Pierce z Bell Laboratories, aby "doradza� Departamentowi Obrony, Centralnej Agencji Wywiadowczej oraz National Science Foundation o badaniach i rozwoju w dziedzinie mechanicznego t�umaczenia j�zyk�w obcych. " Komitet opublikowa� sw�j raport w sierpniu 1965 r. I stwierdzi� mi�dzy innymi, �e "nie ma bezpo�redniej ani przewidywalnej perspektywy przydatnego t�umaczenia maszynowego". Zalecili wsparcie dla podstawowej nauce o j�zykoznawstwie i "pomoce" w t�umaczeniu, ale nie w celu dalszego wsparcia w pe�ni automatycznego t�umaczenia. Raport spowodowa� radykalne ograniczenie finansowania na du�� skal� bada� nad t�umaczeniem maszynowym. Niemniej t�umaczenie maszynowe przetrwa�o i ostatecznie rozkwit�o, co zobaczymy p�niej. Stowarzyszenie T�umacze� Maszynowych i Lingwistyki Komputerowej (AMTCL) odby�o swoje pierwsze spotkanie w 1962 r. W 1968 r. Zmieni�o nazw� na Stowarzyszenie Lingwistyki Komputerowej (ACL) i sta�o si� mi�dzynarodowym towarzystwem naukowym i zawodowym dla os�b pracuj�cych nad problemami zwi�zanymi z j�zyk naturalny i obliczenia. Wydaje kwartalnik Lingwistyka obliczeniowa oraz sponsoruje konferencje i warsztaty.

Odpowiedzi na pytania

Opr�cz pracy nad t�umaczeniem maszynowym badacze zacz�li bada�, w jaki spos�b zdania w j�zyku naturalnym, takim jak angielski, mo�na wykorzysta� do komunikacji z komputerami. Przypomnisz sobie program ELIZA firmy Weizenbaum, kt�ry by� w stanie zaanga�owa� osob� w rozmow�, mimo �e program "nie zrozumia�" niczego o tym, co zosta�o powiedziane. Wspomnia�em ju� o systemie SIR Rafaela, kt�ry m�g�by reprezentowa� przekazane mu informacje, a nast�pnie odpowiada� na pytania. Wspomn� o kilku innych projektach, kt�re maj� w tym okresie pochwali� si� przetwarzaniem j�zyka naturalnego. Program o nazwie BASEBALL (napisany w IPL-V, specjalnym j�zyku programowania do przetwarzania list opracowanym przez Newella, Shawa i Simona) zosta� opracowany w Lincoln Laboratory pod kierunkiem Berta Greena, profesora psychologii na Carnegie Institute of Technology. Potrafi� odpowiedzie� na proste angielskie pytania dotycz�ce baseballu, korzystaj�c z bazy danych o grach baseballowych rozgrywanych w Ameryce w ci�gu jednego roku. Na przyk�ad mo�e odpowiedzie� na pytanie takie jak "Gdzie grali Red Sox 7 lipca?" Pytania musia�y mie� szczeg�lnie prost� form� i ogranicza� si� do s��w w s�owniku programu. Wed�ug autor�w Pytania s� ograniczone do jednej klauzuli; zakazuj�c struktur z klauzulami zale�nymi, analiza sk�adniowa jest znacznie uproszczona. Logiczne po��czenia, takie jak i, lub, i nie, s� zabronione, podobnie jak konstrukcje sugeruj�ce relacje jak najbardziej i najwy�sze. Wreszcie pytania dotycz�ce kolejnych fakt�w, takie jak "Czy Red Sox wygrali kiedykolwiek sze�� gier z rz�du?" s� zakazane. Program dzia�a�, przekszta�caj�c pytanie w specjaln� form� zwan� "list� specyfikacji", wykorzystuj�c zar�wno specjalne analizy sk�adniowe, jak i analizy semantyczne. Ta lista by�aby nast�pnie wykorzystana do uzyskania dost�pu do bazy danych programu w celu znalezienia odpowiedzi na pytanie. Na przyk�ad pytanie "Gdzie grali Red Sox w dniu 7 lipca? "Zostanie najpierw przekonwertowane na list�:

Miejsce =?
Dru�yna = Red Sox
Miesi�c = lipiec
Dzie� = 7

Autorzy twierdzili, �e ich "ograniczenia by�y tymczasowymi �rodkami, kt�re zostan� usuni�te w p�niejszych wersjach programu" .O ile mi wiadomo, nie by�o p�niejszych wersji programu. (Jak zobaczymy, jak rozwinie si� moja historia sztucznej inteligencji, jest kilka przypadk�w, w kt�rych bardzo trudno by�o usun�� "tymczasowe "ograniczenia.). Inny program w j�zyku naturalnym, SAD SAM, zosta� napisany w IPL-V w 1962 -1963 r. przez Roberta Lindsaya w Carnegie Institute of Technology. Mo�e analizowa� angielskie zdania na temat relacji rodzinnych i zakodowa� te relacje w drzewie genealogicznym. Korzystaj�c z drzewa, m�g�by nast�pnie odpowiedzie� na angielskie pytania dotycz�ce zwi�zk�w. Na przyk�ad, je�li SAD SAM otrzyma�o zdanie "Joe i Jane s� potomstwem Toma, "stworzy�oby struktur� listy drzewa dla pewnej" jednostki rodzinnej ", w kt�rej Tom jest ojcem, a Joe i Jane s� dzie�mi. otrzyma� zdanie "Mary jest matk� Jane", doda�oby Mary do tej struktury jako �ony Toma. Wtedy by�by w stanie odpowiedzie� na pytanie "Kim jest matka Joe?" SAD SAM jest akronimem dla Rzeczoznawc�w Zda�, Diagrammera i Analiz Semantycznych Maszyny. Cz�� SAD przeanalizowa�a zdania wej�ciowe i przekaza�a je do SAM, kt�ry wyodr�bni� informacje semantyczne potrzebne do budowy drzew genealogicznych i znalezienia odpowiedzi na pytania. Akceptuj szerok� gam� zda� w podstawowym j�zyku angielskim - system gramatyki i s�ownictwo oko�o 850 s��w okre�lonych przez Charlesa K. Ogdena ,Roberta F. Simmonsa, psychologa i j�zykoznawcy w Systems Development Corporation (SDC) ) w Santa Monica w Kalifornii , mia� wi�ksze cele dla w�asnej pracy w przetwarzaniu j�zyka naturalnego. Wed�ug strony "In Memoriam" autorstwa Gordona Novaka, jednego z jego doktor�w. Marzeniem Simmonsa by�o to, �e mo�na by�o "rozmawia� z ksi��k�", komputer czyta� ksi��k�, a nast�pnie u�ytkownik m�g� z ni� porozmawia�, zadaj�c pytania, na kt�re nale�y odpowiedzie�, rozumiej�c ksi��k� . Osi�gni�cie tego "marzenia" okaza�oby si� r�wnie trudne jak sama sztuczna inteligencja. W notatce z 1961 r. o swoim projekcie "Synthex" Simmons opisa�, jak powinien zacz��:

Celem tego projektu jest opracowanie metodologii badawczej i pojazdu do projektowania i budowy og�lnego przeznaczenia skomputeryzowany system do syntezy z�o�onych ludzkich funkcji poznawczych. Pierwotny pojazd, proto-synthex, b�dzie podstawowym urz�dzeniem do przetwarzania j�zyka, kt�re odczytuje proste materia�y drukowane i odpowiada na proste pytania sformu�owane w podstawowym j�zyku angielskim."

W 1965 r. Simmons i Lauren Doyle przeprowadzili eksperymenty z systemem Protosynthex. Wed�ug raportu Trudi Bellardo Hahna:

"W systemie za�adowano ma�� prototypow� baz� pe�notekstow� rozdzia��w encyklopedii dzieci�cej (Golden Book). Protosynthex m�g� odpowiedzie� na proste pytania w j�zyku angielskim z" odpowiedzi� ". […] by� pionierem w u�ywaniu j�zyka naturalnego do wyszukiwania tekstu ".

W mi�dzyczasie doktor Daniel G. Bobrow , student Marvina Minsky′ego na MIT, napisa� zestaw program�w, zwanych systemem STUDENT, kt�re mog�yby rozwi�za� problemy z algebr� / histori� podane w ograniczonym podzbiorze j�zyka angielskiego. Oto przyk�ad problemu, kt�ry STUDENT m�g�by rozwi�za�:

Odleg�o�� z Nowego Jorku do Los Angeles wynosi 3000 mil. Je�li… �rednia pr�dko�� samolotu odrzutowego wynosi 600 mil na godzin� oraz czas podr�y samolotem z Nowego Jorku do Los Angeles. STUDENT rozwi�za� problem, wykorzystuj�c pewne znane zale�no�ci dotycz�ce pr�dko�ci i odleg�o�ci do skonfigurowania i rozwi�zania odpowiednich r�wna�. Praca Bobrowa poda�a kilka innych przyk�ad�w problem�w, kt�re STUDENT m�g� rozwi�za�, oraz zastosowanych metod.

Historia Sztucznej InteligencjiArtificial Intelligence Experts

Przetwarzanie J�zyka Naturalnego