Algorytmy sortujące - wstęp

...
uses Windows;

var
  qpf       : int64;    // ilość taktów procesora na sekundę
  qpc1,qpc2 : int64;    // stany liczników 64-bitowych
  tqpc      : int64;    // czas operacji odczytu czasu
  t         : extended; // czas w sekundach 
...
  if QueryPerformanceFrequency(addr(qpf)) then
  begin

  // kalibrujemy czas operacji pomiaru czasu

    QueryPerformanceCounter(addr(qpc1));
    QueryPerformanceCounter(addr(qpc2));
    tqpc := qpc2 - qpc1;
...
  // wykonujemy pomiar czasu
    QueryPerformanceCounter(addr(qpc1));

  // tutaj jest kod, którego czas pracy mierzymy

    QueryPerformanceCounter(addr(qpc2));
    t := (qpc2 - qpc1 - tqpc) / qpf; // czas w sekundach
...
  end
  else
    writeln('Na tym komputerze program testowy nie pracuje...');
...


		Przykłady w języku Pascal zostały przetestowane w środowisku DevPascal - środowisko IDE firmy Bloodshed Software, które można zupełnie darmowo pobrać z Internetu. Aby uruchomić nasze przykłady, należy w środowisku DevPascal utworzyć aplikację konsoli, a następnie zaznaczyć na stronie WWW odpowiedni fragment obejmujący tekst programu, skopiować go do schowka Windows, wkleić do edytora DevPascala, skompilować i uruchomić. Dochodzą do nas sygnały, iż nie potraficie zainstalować poprawnie środowiska DevPascal. Dlatego podajemy poniżej dokładną procedurę instalacji: Pobierz z Internetu plik instalacyjny pakietu DevPascal na swój dysk twardy. Możesz skorzystać z witryny producenta lub w razie problemów z naszej kopii (która jednakże może być starszą wersją oprogramowania). Uruchom pobrany program i zainstaluj pakiet zgodnie z propozycją instalatora do katalogu c:\Dev-Pas\. Po instalacji wejdź do katalogu c:\Dev-Pas\ i zmień nazwę zawartego tam katalogu Icons na Icon. Następnie utwórz wewnątrz katalogu c:\Dev-Pas\ katalog Prj. Każdy nowy projekt umieszczaj w Prj w osobnym katalogu, np. p001, p002 itd. Dzięki temu unikniesz bałaganu na dysku i szybko odszukasz wszystkie pliki należące do projektu. Unikaj w nazwach katalogów znaku spacji - to ważne, w przeciwnym razie kompilator może nie odnaleźć potrzebnych mu plików i program wynikowy nie zostanie utworzony. Teraz jesteś gotowy do rozpoczęcia pracy ze środowiskiem DevPascal. Środowisko to jest tylko edytorem programów, które pracuje w środowisku graficznym Windows. Kompilacji dokonuje natomiast dołączony do niego kompilator FreePascal, który znajduje się w katalogu bin. Dlatego możesz również wejść do tego katalogu i uruchomić wewnętrzny edytor FreePascala o nazwie fp.exe. Jednakże nie polecamy tego rozwiązania - DevPascal jest wygodniejszy. Procedura tworzenia nowego projektu konsoli jest następująca: Uruchom edytor DevPascala. Z menu File wybierz opcję New. Z okienka dialogowego wybierz typ projektu - Console Application. Nadaj nazwę swojemu projektowi - w miarę możliwości bez spacji i bez polskich znaków, np. PR001, a następnie zapisz go na dysku w specjalnie do tego celu utworzonym katalogu projektowym wewnątrz wcześniej przygotowanego katalogu c:\Dev-Pas\Prj\. W nazwach katalogów unikaj spacji i polskich znaków. Po zapisaniu pliku projektu na dysku zostaje utworzony plik tekstu programu. Zapisz ten plik na dysku w tym samym katalogu, co plik projektu nadając mu nazwę np. PGR001 lub dowolną inną (unikaj spacji i polskich znaków). Wpisz w edytorze odpowiedni tekst programu. Skompiluj go. Jeśli nie ma błędów, uruchom program wynikowy. Nie zapisuj z poziomu DevPascala żadnych plików na dyskietce. Jeśli musisz utworzyć kopie, to zrób to poza środowiskiem DevPascala. Unikniesz wtedy różnych dziwnych sytuacji, z którymi borykają się nasi nieuważni uczniowie - autor stosuje te zasady od kilku lat i nie napotkał jeszcze żadnych problemów z pakietem DevPascal, o których informują go czytelnicy serwisu. Jedyna rada jest następująca: BACZ CO CZYNISZ, GDZIE CZYNISZ I JAK TO CZYNISZ! W razie problemów proszę skontaktować się z autorem artykułu.


		Przykłady w języku C++ uruchomiono w środowisku DevC++, które również jest dziełem firmy Bloodshed Software - zachęcamy do pobrania z Internetu tego darmowego oprogramowania. Aby uruchomić przykłady, należy w środowisku DevC++ utworzyć projekt aplikacji konsoli, a następnie zaznaczyć na stronie WWW odpowiedni fragment obejmujący tekst programu, skopiować go do schowka Windows, wkleić do edytora DevC++, skompilować i uruchomić. W razie problemów proszę skontaktować się z autorem artykułu. Jeśli masz kłopoty z pobraniem DevC++ z witryny firmowej, to spróbuj tutaj.


		Przykłady w języku Basic uruchomiono w środowisku FreeBasic - darmowy kompilator, który można ściągnąć z sieci Internet ze strony twórców tegoż programu lub też z naszego serwera. (istnieje również wersja dla systemu Linux). Ten pierwszy sposób jest lepszy, ponieważ otrzymujesz najnowszą wersję. Podane przykłady kopiujesz z naszych stron poprzez schowek do edytora FreeBasica, kompilujesz i uruchamiasz. Instalacja FreeBasica jest bardzo prosta: Pobrane archiwum zip rozpakuj do dowolnego katalogu (najlepiej do katalogu głównego na dysku C:/). Powstanie katalog FreeBasic. Wejdź do katalogu FreeBasic i uruchom plik install.bat, który zainstaluje wszystkie biblioteki. Kompilator jest gotowy. Jeśli dystrybucję pobrałeś z naszego serwera, to zawiera ona już edytor programów FBIDE.EXE i jest pakietem instalacyjnym, który automatycznie rozpakuje i zainstaluje wszystkie niezbędne pliki (Free Basic Integrated Developement Environment). Jeśli dystrybucję pobrałeś ze strony producenta, to posiadasz tylko kompilator FBC.EXE. Musisz zatem dodatkowo zainstalować edytor programów, aby wygodnie pracować z tym pakietem. Edytor poszukaj na sieci. Masz duży wybór.


		Przykłady w języku JavaScript można uruchomić nawet przy pomocy ogólnie dostępnego Notatnika z systemu Windows. Jednakże nie polecamy tego sposobu - my korzystaliśmy z programu Microsoft Frontpage. Aby uruchomić przykłady, należy zaznaczyć na stronie WWW fragment obejmujący tekst programu wraz z odpowiednim kodem HTML, skopiować go do schowka Windows, wkleić do notatnika lub edytora kodu html w programie FrontPage i zapisać na dysku pod dowolną nazwą z rozszerzeniem htm lub html (np. index.html). Tak utworzony plik możemy w dalszej kolejności uruchomić w dowolnej przeglądarce internetowej - najlepiej Internet Explorer. W razie problemów proszę skontaktować się z autorem artykułu.
O(n)	Algorytm o liniowej zależności czasu wykonania od ilości danych. Dwukrotny wzrost liczby przetwarzanych danych powoduje dwukrotny wzrost czasu wykonania. Tego typu złożoność powstaje, gdy dla każdego elementu należy wykonać stałą liczbę operacji.
O(n²)	Algorytm, w którym czas wykonania rośnie z kwadratem liczby przetwarzanych elementów. Dwukrotny wzrost liczby danych powoduje czterokrotny wzrost czasu wykonania. Tego typu złożoność powstaje, gdy dla każdego elementu należy wykonać ilość operacji proporcjonalną do liczby wszystkich elementów.
O(n logn)	Dobre algorytmy sortujące mają taką właśnie złożoność obliczeniową. Czas wykonania przyrasta dużo wolniej od wzrostu kwadratowego. Tego typu złożoność powstaje, gdy zadanie dla n elementów można rozłożyć na dwa zadania zawierające po połowie elementów.
O(n!) O(aⁿ)	Bardzo pesymistyczne algorytmy, czas wykonania rośnie szybko ze wzrostem liczby elementów wejściowych, czyli znalezienie rozwiązania może zająć najszybszym komputerom całe wieki lub tysiąclecia. Takich algorytmów należy unikać jak ognia !
Lp.	n	Czas obliczeń
1.	100	= 1 sekunda
2.	1.000	= 100 sekund = 1 minuta 40 sekund
3.	10.000	= 10.000 sekund = 2 godziny 46 minut 40 sekund
4.	100.000	= 1.000.000 sekund = 11 dni 13 godzin 46 minut 40 sekund
5.	1.000.000	= 100.000.000 sekund = 3 lata 2 miesiące 9 godzin 46 minut 40 sekund
6.	10.000.000	= 1 ^x10¹⁰sekund = 317 lat 1 miesiąc 4 dni 17 godzin 46 minut 40 sekund
t_po	-	czas sortowania zbioru posortowanego. Nie, to nie jest pomyłka. Pomiar tego czasu da nam odpowiedź, czy algorytm wykorzystuje fakt posortowania zbioru.
t_od	-	czas sortowania zbioru uporządkowanego odwrotnie. To zwykle jest ciężki orzech do zgryzienia dla algorytmów, które w typowych warunkach radzą sobie całkiem sprawnie. Tego typu sytuacja występuje przy zmianie kierunku uporządkowania zbioru, który wcześniej został już posortowany.
t_pp	-	czas sortowania zbioru uporządkowanego, w którym pierwszy element przyjmuje wartość losową. Wykonamy dziesięć sortowań dla każdego zbioru uśredniając wynik. Tego typu sytuacja występuje przy dodawaniu nowego elementu na początku zbioru już uporządkowanego.
t_pk	-	czas posortowania zbioru uporządkowanego, w którym ostatni element przyjmuje wartość losową. Wykonamy dziesięć sortowań uśredniając wynik. Tego typu sytuacja występuje przy dodawaniu nowego elementu na końcu zbioru uporządkowanego.
t_np	-	czas posortowania zbioru z losowym rozkładem elementów. Wykonamy dziesięć sortowań uśredniając wynik. Ten czas poinformuje nas, jak dany algorytm radzi sobie w typowych warunkach.
Środowisko pracy programu testującego
Element	Stan
Procesor	Intel Pentium Celeron 1,7GHz
RAM	512MB
System	Windows XP Professional SP 2
Sieć	Wyłączona
Inne programy	Wyłączone
n	- liczba przetwarzanych elementów
t(n)	- czas przetwarzania n-elementów w algorytmie
c	- stała proporcjonalności pomiędzy t(n) a n²
		mnożnik:	1,00E+03	1,00E+06	1,00E+12	1,00E+04
Lp	n	t(n)	O(n)?	O(n²)?	O(n³)?	O(nlogn)?
1	1000	1,057523	1,06	1,06	1057,52	1,06
2	2000	4,117282	2,06	1,03	514,66	1,88
3	4000	15,921192	3,98	1,00	248,77	3,33
4	8000	61,238923	7,65	0,96	119,61	5,90
5	16000	258,838272	16,18	1,01	63,19	11,58
6	32000	1032,526252	32,27	1,01	31,51	21,56
7	64000	4120,517722	64,38	1,01	15,72	40,33
8	128000	16452,586878	128,54	1,00	7,85	75,76
		Średnio:	32,014	1,009	257,353	20,175