Szukasz poczty? Tylko na WEBD.pl!

Ten czas leci za szybko drodzy Nasi. Nie wiemy jeszcze do końca, czy to związane z ilością tematów, zagadnień, 'tasków', jakie chcemy i systematycznie dla Was wdrażamy, czy może po prostu wieku. 😀

Niezależnie od przyczyn, znaleźliśmy jednak chwilę (i będziemy znajdować kolejne) by tym razem zgłębić zagadnienie o charakterze korespondencyjnym. 😉 Kilka tygodni temu za cel postawiliśmy sobie bowiem przyspieszenie działania wyszukiwarki e-mail w programach pocztowych . Cóż więcej powiedzieć – cel został osiągnięty 😀 Wyszukiwanie poczty e-mail w WEBD.pl po prostu śmiga:) Poniżej kilka tajemnic administracyjnych – co działa, jak działa i dlaczego tak działa, że działa 😉

Jeszcze zanim jednak wywody naszych Adminów – pamiętajcie, że z wyszukiwania maili na WEBD.pl możecie korzystać zarówno na Waszych programach pocztowych typu Outlook czy Thunderbird, oraz za pośrednictwem programów dostępnych na https://poczta.webd.pl, jak tu:

Gość honorowy : Dovecot FTS

Mechanizm wyszukiwania pełnotekstowego zastosowany w serwerze pocztowym WEBD.pl pozwala szybciej przeszukiwać wiadomości na skrzynce pocztowej przy jednoczesnym generowaniu mniejszego obciążenia. Mechanizm FTS (Full Text Search) polega na zbudowaniu indeksów wyszukiwania dla każdej wiadomości, na każdej skrzynce obecnej na serwerze.

Indeksy przechowują podstawowe informacje o wiadomości, takie jak skrzynka, na której znajduje się wiadomość, adres nadawcy, adresy odbiorców czy też słowa kluczowe z samej jej treści. Serwer pocztowy WEBD.pl dba o to, aby informacje o każdej nowej wiadomości podobnie jak i zmiany w samej wiadomości (np. o tym, że wiadomość została oznaczona jako usunięta) były przesyłane na bieżąco.

Przeszukanie indeksów przystosowanych do zapytań jest znacznie szybsze od tradycyjnego wyszukiwania. Tradycyjne wyszukiwanie działa na zasadzie otwierania każdej wiadomości po kolei i sprawdzania czy pasuje ona do wzorca. Przy małej ilości wiadomości jest nie niezauważalne, ale przy dużych skrzynkach, przeczytanie kilkuset tysięcy wiadomości musi swoje potrwać. Nie mówiąc o tym, że otwarcie tylu plików w krótkim czasie generowało bardzo duży ruch na dyskach.

Wyszukiwanie z wykorzystaniem indeksów zamiast otwierać każdą wiadomość osobno, wysyła zapytanie do serwerów odpowiedzialnych za indeksy i w odpowiedzi otrzymuje listę wewnętrznych oznaczeń wiadomości. Następnie serwer pocztowy dopasowuje otrzymane wyniki do wiadomości na skrzynce. Średni czas od wysłania zapytania do serwerów wyszukiwania, do zwrócenia przez nie listy wiadomości, które serwer pocztowy musi u siebie zlokalizować to przy dużych skrzynkach zaledwie pół sekundy, gdzie zwykłe wyszukiwanie potrafiło zająć nawet do kilku minut.

Oczywiście czas potrzeby do wyświetlenia wyniku w kliencie poczty będzie dłuższy i zależny od tego, jak wiele folderów IMAP znajduje się na skrzynce (przy założeniu, że przeszukujemy je wszystkie). Wsparcie wyszukiwania przez osobne serwery przechowujące indeksy wiadomości umożliwia nam obsługiwanie większych skrzynek niż konkurencja, która często nakłada restrykcyjne ograniczenia wielkości skrzynki typu 10GB. Chociaż ograniczenie wielkości skrzynki to łatwiejsze rozwiązanie niż to, które podjęliśmy, to wiemy, że wielu z was nie mogłoby sobie pozwolić na takie ograniczenie.

Wyszukiwanie w liczbach:

Obecnie na serwerach znajduje się ponad 211 milionów wiadomości, których indeksy zajmują 4,4TB miejsca na dyskach. Do obsługi tak dużej bazy indeksów zaangażowanych jest obecnie 13 serwerów.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *