Daboost/Shutterstock

Z niedawne zwolnienie i szybkie ponowne zatrudnienie Sama Altmana przez OpenAI debaty na temat rozwoju i wykorzystania sztucznej inteligencji (AI) po raz kolejny znalazły się w centrum uwagi. Bardziej niezwykłe jest to, że ważnym tematem w doniesieniach medialnych była umiejętność Systemy AI do wykonywania obliczeń matematycznych.

Najwyraźniej część dramatu w OpenAI była związana z opracowaniem przez firmę nowego Algorytm AI o nazwie Q*. System był nazywany znaczącym postępem, a jedną z jego najważniejszych cech była zdolność matematycznego rozumowania.

Ale czy matematyka nie jest podstawą sztucznej inteligencji? Jak system sztucznej inteligencji może mieć problemy z rozumowaniem matematycznym, skoro komputery i kalkulatory mogą wykonywać zadania matematyczne?

AI nie jest pojedynczą jednostką. To zbiór strategii wykonywania obliczeń bez bezpośrednich instrukcji od ludzi. Jak zobaczymy, niektóre systemy AI są kompetentne w matematyce.

Jednak jedna z najważniejszych obecnych technologii, duże modele językowe (LLM) stojące za chatbotami AI, takimi jak ChatGPT, jak dotąd nie potrafiła naśladować rozumowania matematycznego. Dzieje się tak dlatego, że zostały zaprojektowane tak, aby koncentrować się na języku.


wewnętrzna grafika subskrypcji


Jeśli nowy algorytm Q* firmy będzie w stanie rozwiązać niewidziane dotąd problemy matematyczne, może się to udać być znaczącym przełomem. Matematyka jest starożytną formą ludzkiego rozumowania duże modele językowe (LLM) do tej pory starali się naśladować. LLM to technologia leżąca u podstaw systemów takich jak ChatGPT OpenAI.

W chwili pisania tego tekstu szczegóły algorytmu Q* i jego możliwości są ograniczone, ale bardzo intrygujące. Zanim uznamy Q* za sukces, należy wziąć pod uwagę różne subtelności.

Na przykład matematyka jest przedmiotem, którym wszyscy zajmują się w różnym stopniu, a poziom matematyki, w jakim Q* jest kompetentny, pozostaje niejasny. Opublikowano jednak prace akademickie, w których wykorzystuje się alternatywne formy sztucznej inteligencji do rozwijania matematyki na poziomie badawczym (w tym niektóre napisane przeze mniei jeden napisany przez zespół matematyków we współpracy z badaczami z Google DeepMind).

Te systemy sztucznej inteligencji można określić jako kompetentne w matematyce. Jest jednak prawdopodobne, że Q* nie jest wykorzystywane do pomocy pracownikom naukowym w ich pracy, ale raczej jest przeznaczone do innego celu.

Niemniej jednak, nawet jeśli Q* nie jest w stanie przesuwać granic najnowocześniejszych badań, jest bardzo prawdopodobne, że w sposobie jego budowy można odkryć pewne znaczenie, które mogłoby stworzyć kuszące możliwości przyszłego rozwoju.

Coraz wygodniej

Jako społeczeństwo coraz bardziej czujemy się komfortowo, gdy specjalistyczna sztuczna inteligencja jest wykorzystywana do rozwiązywania z góry określonych typów problemów. Na przykład, asystenci cyfrowi, rozpoznawanie twarzy, internetowe systemy rekomendacji będzie znane większości ludzi. To, co pozostaje nieuchwytne, to tzw „sztuczna inteligencja ogólna” (AGI) który ma szerokie możliwości rozumowania porównywalne z ludzkimi.

Matematyka to podstawowa umiejętność, której pragniemy uczyć każde dziecko w wieku szkolnym i z pewnością kwalifikuje się jako fundamentalny kamień milowy w poszukiwaniu AGI. W jaki więc inny sposób matematycznie kompetentne systemy sztucznej inteligencji mogłyby pomóc społeczeństwu?

Matematyczny sposób myślenia ma zastosowanie w wielu zastosowaniach, na przykład w kodowaniu i inżynierii, dlatego rozumowanie matematyczne jest istotną umiejętnością, którą można przenieść zarówno w przypadku ludzkiej, jak i sztucznej inteligencji. Ironią jest to, że sztuczna inteligencja opiera się na podstawowym poziomie na matematyce.

Na przykład wiele technik wdrażanych przez algorytmy sztucznej inteligencji ostatecznie sprowadza się do obszaru matematycznego zwanego algebra macierzowa. Matryca to po prostu siatka liczb, której znanym przykładem jest obraz cyfrowy. Każdy piksel jest nic więcej niż dane liczbowe.

Duże modele językowe są również z natury matematyczne. Na podstawie ogromnej próbki tekstu maszyna może poznać prawdopodobieństwa występujących słów najprawdopodobniej postąpi zgodnie z monitem (lub pytaniem) użytkownika do chatbota. Jeśli chcesz, aby wstępnie przeszkolony LLM specjalizował się w konkretnym temacie, można go dopracować w oparciu o literaturę matematyczną lub dowolną inną dziedzinę nauki. LLM może wygenerować tekst, który czyta się tak, jakby rozumiał matematykę.

Niestety, takie postępowanie daje LLM, który jest dobry w blefowaniu, ale kiepski w szczegółach. Problem w tym, że twierdzeniu matematycznemu z definicji można przypisać: jednoznaczna wartość logiczna (to znaczy prawda lub fałsz). Rozumowanie matematyczne sprowadza się do logicznego wyprowadzania nowych twierdzeń matematycznych z wcześniej ustalonych.

adwokat diabła

Naturalnie, każde podejście do rozumowania matematycznego, które opiera się na prawdopodobieństwie językowym, będzie wykraczać poza swój tor. Jednym ze sposobów obejścia tego może być włączenie do architektury pewnego systemu weryfikacji formalnej (dokładnie tego, jak zbudowany jest LLM), który w sposób ciągły sprawdza logikę kryjącą się za skokami dokonywanymi przez model dużego języka.

Wskazówka, że ​​tak się stało, może znajdować się w nazwie Q*, do której można wiarygodnie się odnosić algorytm opracowany już w latach 1970. XX wieku pomoc w rozumowaniu dedukcyjnym. Alternatywnie Q* może odnosić się do Q-learningu, w którym model można z czasem udoskonalać poprzez testowanie i nagradzanie poprawnych wniosków.

Istnieje jednak kilka wyzwań związanych z budowaniem matematycznej sztucznej inteligencji. Na przykład niektóre z najciekawszych zagadnień matematycznych składają się z wysoce nieprawdopodobnych zdarzeń. Istnieje wiele sytuacji, w których można pomyśleć, że istnieje wzorzec oparty na małych liczbach, ale nieoczekiwanie załamuje się on, gdy sprawdzi się wystarczającą liczbę przypadków. Ta funkcja jest trudna do wbudowania w maszynę.

Kolejne wyzwanie może zaskoczyć: badania matematyczne mogą być bardzo kreatywne. Musi tak być, ponieważ praktycy muszą wymyślać nowe koncepcje, a jednocześnie trzymać się zasad formalne zasady starożytnego przedmiotu.

Jakakolwiek metodologia sztucznej inteligencji wytrenowana wyłącznie w celu znalezienia wzorców w istniejącej wcześniej matematyce prawdopodobnie nigdy nie mogłaby stworzyć prawdziwie nowej matematyki. Biorąc pod uwagę powiązanie matematyki i technologii, wydaje się, że wyklucza to koncepcję nowych rewolucji technologicznych.

Pobawmy się jednak na chwilę w adwokata diabła i wyobraźmy sobie, czy sztuczna inteligencja rzeczywiście mogłaby stworzyć nową matematykę. Poprzedni argument przeciwko temu ma wadę, ponieważ można również powiedzieć, że najlepsi matematycy również byli szkoleni wyłącznie w oparciu o istniejącą wcześniej matematykę. Duże modele językowe zaskakiwały nas już wcześniej i zrobią to ponownie.Konwersacje

Tom Oliver, Wykładowca Informatyki i Inżynierii, University of Westminster

Artykuł został opublikowany ponownie Konwersacje na licencji Creative Commons. Przeczytać oryginalny artykuł.