2014-07-05 21:14 GMT+02:00 rysiek <rysiek@hackerspace.pl>:
Ale możesz wtedy zmienić te słowa kluczowe. I co, czym się w końcu zajmą?
Spacjami?

Tym do kogo wysyłasz maile. Skąd wysyłasz maile. Od kiedy znasz się z adresatem. Czy jesteście znajomymi na Facebooku. Jakie Twój adresat ma powiązania. Ilu macie wspólnych znajomych. Jaka była wasza korespondencja zanim zaczęliście wszystko zalewać keywordami.

Żadna korespondencja nie istnieje w izloacji. O ile do niedawna można było to traktować jedynie jako moje standardowe gadanie o "Wielkiej Sieci Przyczynowości" to teraz wiemy, że NSA (i inne agencje) dysponują wystarczającą ilością danych, by móc do pewnego stopnia w tę sieć stworzyć. Mając zunifikowane profile ludzi oparte o różne źródła podsłuchiwanej komunikacji uzupełnienie brakujących informacji (typu np. przynależność kogoś do jakiejś tajnej organizacji) bądź odfiltrowanie celowo wprowadzanego szumu jest kwestią prostych, standardowych algorytmów statystycznych/machine learning. A zatrudniają dobrych matematyków.

Polecam poniższy artykuł jako przykład jakie rzeczy da się odtworzyć używając debilnie prostej matmy:
http://kieranhealy.org/blog/archives/2013/06/09/using-metadata-to-find-paul-revere/

Jak ktoś sobie chce bardziej powyginać mózg, to polecam np.
http://lesswrong.com/lw/ev3/causal_diagrams_and_causal_models/
jako przykład tego, jak z danych o *samej korelacji* da się odtworzyć co powoduje co. Jakiś czas temu uważano to za niemożliwe. Dziś wiemy, że wystarczy do tego prosta bayesowska matma.

I tak jak mówię, to są przykłady użycia stosunkowo trywialnych algorytmów. Ludziom w NSA płacą konkretną kasę za wymyślanie dużo bardziej ambitnych metod.

The Great Web of Causality is a real thing. With enough data, no lie remains undiscovered.

Jacek Złydach,
http://temporal.pr0.pl/devblog | http://esejepg.pl | http://hackerspace-krk.pl
TRC - Bringing you tomorrow's solutions yesterday.