online kłamie 6 29

W życiu można być pewnym trzech rzeczy: śmierci, podatków i kłamstwa. Wydaje się, że to ostatnie z pewnością zostało potwierdzone przez niedawne referendum w sprawie brexitu w Wielkiej Brytanii numer ukończenia Opuść kampanie Zastawy patrząc więcej lubić paszteciki z wieprzowiny niż twarde prawdy.

Ale od reklam internetowych, wniosków wizowych i artykułów naukowych po blogi polityczne, roszczenia ubezpieczeniowe i profile randkowe, istnieje niezliczona ilość miejsc, w których możemy kłamać cyfrowo. Jak więc można wykryć te internetowe kłamstwa? Cóż, Stephan Ludwig z University of Westminster, Ko de Ruyter z Cass Business School na londyńskim City University, Mike Friedman z Katolickiego Uniwersytetu w Louvain i twoi naprawdę opracowali cyfrowy wykrywacz kłamstw – i może on wykryć całe mnóstwo internetowych nieprawd .

W naszym nowym badaniu, wykorzystaliśmy wskazówki językowe, aby porównać dziesiątki tysięcy e-maili wstępnie zidentyfikowanych jako kłamstwa z tymi, o których wiadomo, że są zgodne z prawdą. Na podstawie tego porównania opracowaliśmy algorytm analizy tekstu, który może wykryć oszustwo. Działa na trzech poziomach.

1. Używanie słów

Wyszukiwanie według słów kluczowych może być rozsądnym podejściem w przypadku dużych ilości danych cyfrowych. Tak więc najpierw odkryliśmy różnice w użyciu słów między tymi dwoma zestawami dokumentów. Te różnice identyfikują tekst, który prawdopodobnie zawiera kłamstwo. Odkryliśmy, że osoby, które kłamią, zazwyczaj używają mniej zaimków osobowych, takich jak ja, ty i on/ona, a więcej przymiotników, takich jak błyskotliwy, nieustraszony i wzniosły. Używają również mniejszej liczby zaimków w pierwszej osobie liczby pojedynczej, takich jak ja, ja, mój, z rozbieżnymi słowami, takimi jak mógłbym, powinienem, chciałbym, a także więcej zaimków w drugiej osobie (ty, twój) ze słowami osiągnięć (zarobić, bohater , wygrać).

Mniej zaimków osobowych wskazuje na próbę odcięcia się autora od jego słów, podczas gdy użycie większej liczby przymiotników jest próbą odwrócenia uwagi od kłamstwa poprzez lawinę zbędnych opisów. Mniej zaimków w pierwszej osobie liczby pojedynczej w połączeniu ze słowami rozbieżnymi wskazuje na brak subtelności i pozytywnego obrazu siebie, podczas gdy więcej zaimków w drugiej osobie w połączeniu ze słowami osiągnięć wskazuje na próbę schlebiania odbiorcom. Dlatego uwzględniliśmy te kombinacje wyszukiwanych haseł w naszym algorytmie.


wewnętrzna grafika subskrypcji


2. Kontrola struktury

Kolejna część rozwiązania polegała na analizie wariancji słów procesu poznawczego, takich jak przyczyna, ponieważ, wiedzieć i powinno – i zidentyfikowaliśmy związek między słowami strukturalnymi a kłamstwami.

Kłamcy nie mogą generować oszukańczych e-maili z rzeczywistej pamięci, więc unikają spontaniczności, aby uniknąć wykrycia. Nie oznacza to, że kłamcy używają ogólnie więcej słów związanych z procesami poznawczymi niż ludzie, którzy mówią prawdę, ale używają tych słów bardziej konsekwentnie. Na przykład mają tendencję do łączenia każdego zdania z następnym – „wiemy, że to się stało z tego powodu, bo tak powinno być”. Nasz algorytm wykrywa takie użycie słów procesowych w komunikacji.

3. Podejście cross-email

Zbadaliśmy również, w jaki sposób nadawca e-maila zmienia swój styl językowy, wymieniając kilka e-maili z kimś innym. Ta część badania ujawniła, że ​​w miarę postępu wymiany nadawca miał tendencję do używania słów funkcyjnych, których używał odbiorca.

Słowa funkcyjne to słowa, które przyczyniają się do składni lub struktury, a nie do znaczenia zdania – na przykład an, am, to. A nadawcy zmienili styl językowy swoich wiadomości, aby dopasować go do stylu odbiorcy. W rezultacie nasz algorytm identyfikuje i gromadzi takie dopasowania.

Ekscytujące aplikacje

Organy nadzorujące konsumentów mogą wykorzystywać tę technologię do przypisywania reklamom o wątpliwym charakterze oceny „prawdopodobnie kłamliwej”. Firmy ochroniarskie i krajowe służby graniczne mogą wykorzystywać algorytm do oceny dokumentów, takich jak wnioski wizowe i karty lądowania, w celu lepszego monitorowania zgodności z zasadami i przepisami dotyczącymi dostępu i wjazdu. Sekretarze komisji egzaminacyjnych szkół wyższych i redaktorzy czasopism akademickich mogą udoskonalić swoje narzędzia sprawdzające do automatycznego sprawdzania prac dyplomowych studentów i artykułów naukowych pod kątem plagiatu.

W rzeczywistości potencjalnych zastosowań jest coraz więcej. Blogi polityczne mogą z powodzeniem monitorować swoje interakcje w mediach społecznościowych pod kątem anomalii tekstowych, podczas gdy serwisy randkowe i serwisy z recenzjami mogą klasyfikować wiadomości przesłane przez użytkowników na podstawie ich oceny „prawdopodobnie kłamliwej”. Firmy ubezpieczeniowe mogą lepiej wykorzystać swój czas i zasoby dostępne na potrzeby kontroli roszczeń. Dzięki naszemu algorytmowi księgowi, doradcy podatkowi i specjaliści kryminalistyki mogą badać sprawozdania finansowe i roszczenia podatkowe oraz znajdować oszukańcze pistolety.

Ludzie są zaskakująco źli w świadomym wykrywaniu oszustwa. Rzeczywiście, ludzka dokładność, jeśli chodzi o wykrycie kłamstwa, wynosi zaledwie 54%, niewiele lepsze niż przypadek. Tymczasem nasz cyfrowy wykrywacz kłamstw jest dokładny w 70%. Można go wykorzystać do walki z oszustwami wszędzie tam, gdzie występują one w treściach komputerowych, a wraz z rozwojem technologii jego ostrzeżenia Pinokio mogą być w pełni zautomatyzowane, a ich dokładność jeszcze bardziej wzrośnie. Tak jak nos Pinokia odruchowo sygnalizował kłamstwo, tak robi nasz cyfrowy wykrywacz kłamstw. Włókniarze strzeżcie się.

O autorze

KonwersacjeTom van Laer, starszy wykładowca marketingu, City University London

Ten artykuł został pierwotnie opublikowany w Konwersacje. Przeczytać oryginalny artykuł.

Powiązane książki

at Rynek wewnętrzny i Amazon