Google Hacking Arkadiusz Firus a.firus[at]students.mimuw.edu.pl
Google hacking ● Historia ● Usługi ● Jak pytać ● Co można znaleźć ● Jak się bronić ● Ciekawostki
Idea Google Misją Google jest uporządkowanie światowych zasobów informacji, aby stały się one powszechnie dostępne i użyteczne. Do no evil Zbudujmy narzędzie, które będzie popularne. Zyski przyjdą same.
Historia Larry Page Sergey Brin Założyciele Przewodniczący Dr. Eric Schmidt
Oferowane usługi ● Wyszukiwarki ● Dodatki dla webmasterów ● Aplikacje ● Google dla firm ● Google na komórki
Dodatki dla webmasterów
Możliwości wyszukiwarki ● Pamięć podręczna dla stron ● Kalkulator ● Definicje ● Typy plików ● Szczęśliwy traf ● Ładowanie z wyprzedzeniem (firefox)
Możliwości wyszukiwarki (2) ● Podobne strony ● Wyszukiwanie w witrynie ● Połączone witryny ● Sprawdzanie pisowni ● Tłumaczenie stron ● Konwersja do html
Cechy wyszukiwarki ● Wielkość liter jest bez znaczenia ● Automatyczny iloczyn (AND) ● Automatyczne usunięcie popularnych słów („how”, „and”,...) ● Ignorowanie (choć nie do końca) znaków narodowych („ladny” = „ładny” + „ladny”) ● Odmiana wyrazów.
Podstawowe operatory | (pipe lub „OR”)- alternatywa - (minus)- wykluczenie wyrazu + (plus)- wyraz musi być w wyniku ~ (tylda)- wyrazy bliskoznaczne (dla polskiego języka działa słabo) „wyrażenie”- szukamy dokładnego wyrażenia * (gwiazdka)- dowolny ciąg słów. (kropka)- zastępuje spację Można (a nawet należy) używać nawiasowania do ustalenia priorytetów.
Operatory zaawansowane cache:- kopia lokalna link:- linki do related:- strony podobne do info:- informacje o define:- definicja słowa site:- tylko w danej domenie [all]intitle:- fraza muszą być w tytule [all]inurl:- fraza musi być w URL [all]intext- fraza musi być w tekście [all]inanchor- fraza musi być w odnośnikach filetype:- tylko pliki/w plikach danego typu
Struktura URL i&ie=utf-8&oe=utf-8&client=firefox-a&hl=pl&bl=lang_pl ?- po nim podajemy parametry &- rozdziela parametry q- nasze zapytanie ie- kodowanie wejściowe oe- kodowanie wyjściowe client- nazwa klienta num- limit wyników na stronie hl- język przegladarki lr- wyniki tylko w języku (np. lang_pl) bntl- szczęśliwy traf strip=1- sam tekst (tylko kopia lokalna)
Co nas interesuje? 1) Pliki z loginami lub hasłami: passwd, shadow, htaccess, htpasswd, htusers,... 2)Kopie zapasowe: rozszerzenia bak, old,... 3) Logi: rozszerzenie log lub np. bash_history
Co nas interesuje? 4) Strony urządzeń sieciowych inurl:hp/device/this.LCDispatcher 5) Wulgaryzmy występują często w wersjach testowych 6) Plików robots.txt (o tym później) 7) Adresy owe to głównie dla spamerów
Przykładowe zapytania intitle:index.of chopin (mp3|wav|ogg|flac) ciekawe czy dużo osób słucha Chopina? hasełka do stron internetowych intitle:index.of site:mimuw.edu.pl komu nie chciało się utworzyć pliku index.html? intitle:index.of chopin (mp3|wav|ogg|flac) ciekawe czy dużo osób słucha Chopina? hasełka do stron internetowych intitle:index.of site:mimuw.edu.pl komu nie chciało się utworzyć pliku index.html?
Do czego jeszcze można wykorzystać google 1) Anonimowe Proxy 2) DNS Discovering 3) Obchodzenie zabezpieczeń podszywamy się pod googlebot'a
Google Kalendarz 1) Ludzie zmieniają hasła change password 2) Klucze WEP WEP 3) Popodsłuchujemy troche? passcode
Jak się bronić? 1) Polityka bezpieczeństwa edukacja pracowników 2) Prawa dostępu do plików 3) Zmieniamy standardowe nazwy (np. „Index of”) lub tworzymy plik index.html 4) Sami odpytujemy google i usuwamy niechciane pozycje.
Jak się bronić? 5) Instruujemy roboty robots.txt 6) Ostatnie, ale najważniejsze: MYŚLIMY
Search Engine Optimalization, czyli jak być pierwszym ● Domena ● Dobrze napisana strona: – jak najbliżej standardu – używanie tagów – dobrze opisane linki ● Linki z innych stron (najlepiej o wysokim PageRank)
Ciekawostki
the answer to life, the universe and everything
Więcej informacji ● ● ● ●