Andrzej Borowik Edukacja informatyczna i medialna Rok III grupa 1 Metody poszukiwania i selekcji informacji
Zaprezentowanie możliwości programu Finereader 8.0 służącego do wyodrębnienia tekstu ze zdjęć.
Plan zajęć dzisiejszej lekcji dotyczący programu Finereader Pobranie programu i zainstalowanie go na dysku C:\Finereader Umieszczenie dokumentu tekstowego w skanerze i włączenie urządzenia Uruchomienie programu i przetworzenie dokumentu Umieszczenie wyodrębnionego tekstu w edytorze Word i ewentualne poprawki tekstu.
Cele do realizacji na dzisiejszej lekcji Nauka zeskanowanych dokumentów tekstowych z dysku lub bezpośrednio ze skanera, Przeróbka tekstu w pionie, Przeróbka tekstu w poziomie, Eliminacja błędów podczas skanowania, Formy zapisu przetworzonego tekstu.
WSTĘP Kilka słów na temat komputera. Komputer (z ang. computer od łac. computare – obliczać, dawne nazwy: mózg elektronowy, elektroniczna maszyna cyfrowa, maszyna matematyczna), maszyna elektroniczna (urządzenie) służąca do przetwarzania wszelkich informacji, które da się zapisać w formie ciągu cyfr, albo sygnału ciągłego. Najpopularniejszym obecnie rodzajem komputera jest stacjonarny komputer osobisty (desktop), z tego powodu potocznie traktowany jest jako synonim komputera w ogóle.
WYJAŚNIENIE PODSTAWOWYCH POJĘĆ. Urządzenie peryferyjne (ang. peripheral device) - dowolna część komputera inna niż CPU lub pamięć komputerowa, jak np. dysk twardy, klawiatura, monitor, mysz, drukarka, skaner, napęd taśmowy, mikrofon, głośnik, aparat fotograficzny, dżojstik, kamera internetowa. Szybka pamięć robocza, jak RAM, ROM czy, dawniej, rdzeń, nie może być określana mianem urządzenia peryferyjnego. Współczesne określenie "urządzenie" jest ogólniejsze w tym sensie, że jest odnoszone do obiektów takich, jak dalekopis, RAM- drive czy karta sieciowa. Niektórzy argumentują, że z nadejściem komputera osobistego płyta główna, dysk twardy, klawiatura, mysz i monitor są częściami podstawowego systemu komputerowego i stosują termin "urządzenie peryferyjne" do dodatkowych, opcjonalnych komponentów maszyny. Co to są urządzenia zewnętrzne?
Co to jest skaner i jego rodzaje. Skaner - w poligrafii urządzenie elektroniczne do rejestrowania i zmieniania tonalności oraz barw reprodukowanego oryginału, a także urządzenie służące do zamiany tekstu bądź obrazu z postaci wydrukowanej do formy elektronicznej, zrozumiałej dla komputera. Skaner działa więc jak kopiarka, z tą różnicą, że kopia zapisywana jest w pamięci komputera. Skanowanie obrazów jest więc proste, natomiast dokumenty tekstowe muszą jeszcze zostać zrozumiane, to znaczy przekonwertowane (przez program OCR) do postaci pliku tekstowego, który może być modyfikowany w edytorze tekstu.. Skanery mogą pobierać informacje w najrozmaitszy sposób, zależnie od sposobu udostępniania informacji przez obiekt z obiektu, który wytworzy dany obiekt przez obiekt, danego obiektu, który uzyskuje dane z obiektu przez dany obiekt. Rodzaje skanerów: optyczne, magnetyczne. elektroniczne i radiowe Skaner optyczny w komputerach to peryferyjne urządzenie wejściowe umożliwiające przetworzenie statycznego obrazu rzeczywistego obiektu (na przykład kartka papieru, powierzchnia ziemi, siatkówka ludzkiego oka) do postaci cyfrowej, w celu dalszej obróbki komputerowej. Skanery optyczne stosuje się w celu przygotowania do obróbki graficznej obrazu, rozpoznawania pisma (na przykład OCR), w systemach zabezpieczeń i kontroli dostępu, badaniach naukowych, medycznych i tak dalej.
Skanery kodów kreskowych służą do automatyzacji procesu wprowadzania danych o towarach do systemu komputerowego lub/oraz przy sprzedaży bezpośredniej. Skanery jednoliniowe są wykorzystywane m.in. w kolektorach danych natomiast skanery wielo liniowe w terminalach kontroli cen w supermarketach. Istnieją również skanery do odczytywania informacji innej niż obraz, na przykład czytniki danych zapisanych w postaci magnetycznej. Magnetyczne czytniki te posiadają głowice odczytujące informację zapisaną zwykle na pasku magnetycznym. W ten sposób są zapisane informacje na przykład na większości kart płatniczych. Elektroniczny czytnik odczytuje informacje zapisane w obiekcie poprzez bezpośredni styk z układem w obiekcie. W ten sposób jest między innymi realizowana autoryzacja użytkownika komputera przy pomocy karty elektronicznej. Radiowy czytnik odczytuje drogą radiową informacje zapisane w obiekcie. Zwykle zasięg takiego czytnika wynosi kilka do kilkunastu centymetrów, choć popularne są także czytniki o zasięgu kilkudziesięciu centymetrów. Ze względu na wygodę użytkowania coraz częściej zastępują rozwiązania oparte na czytnikach magnetycznych na rzykład. w systemach kontroli dostępu.
Zasada działania skanera Światło białe odbite od kolorowego fragmentu oryginału przyjmuje barwę tego fragmentu. To barwne światło, po przejściu przez układ optyczny, pada na filtr dichroiczny, który rozdziela odbity sygnał świetlny na trzy jednakowe strumienie. Powstałe strumienie padają na trzy rzędy czujników fotoelektrycznych. Każdy element czujnika jest pokryty filtrem, odpowiednio: czerwonym R, zielonym G i niebieskim B. W wyniku tego następuje automatyczne odfiltrowanie trzech tzw. podstawowych barw składowych RGB (Red, Green, Blue). Każda składowa ma jasność odpowiednią do koloru światła odbitego od elementu oryginału. Im jasność podstawowej barwy składowej większa, tym większy ładunek, co powoduje, że większy prąd jest generowany przez element fotoczuły. Z kolei w przetworniku A/C sygnał analogowy (prąd) jest zamieniany na sygnał cyfrowy w celu utworzenia pliku cyfrowego. Plik ten może być rozpoznawany i reprodukowany w systemie komputerowym. Zasadę działania skanera płaskiego, w którym uwidoczniono omówione elementy budowy, przedstawia.
OPROGRAMOWANIE. Program do wyczytywania tekstu – finereader. Pod koniec sierpnia premierę miał Abbyy FineReader 8.0, znany chyba wszystkim użytkownikom skanerów znakomity program do rozpoznawania pisma drukowanego (OCR – Optical Character Recognition). Polska wersja językowa aplikacji pojawiła się w sprzedaży już 20 września. Abbyy FineReader 8.0 jest oferowany w dwóch wersjach: Professional i Enterprise. Ta druga ma dodatkowo kilka funkcji sieciowych, przydatnych podczas pracy grupowej w firmach. Działanie programu polega na skanowaniu materiałów zawierających tekst, a następnie jego rozpoznawaniu i konwersji na postać elektroniczną (o przydatności tego narzędzia przekonał się już niejeden student czy uczeń, odrabiający na komputerze prace domowe). FineReader rozpoznaje tekst zapisany w jednym z kilkudziesięciu języków, w tym również polskim. Należy zwrócić uwagę, że działa w systemach Windows 2000/XP/2003. Nie uruchomią go użytkownicy Windows 95/98/Me/NT.
Skanowanie cyfrówką. W rozpoznawaniu tekstów z czytelnych dokumentów drukowanych program osiągnął już niemal stuprocentową skuteczność, co podkreśla producent. Dlatego w pracach nad obecną wersją skupiono się na udoskonaleniu mechanizmów rozpoznawania tekstu z dokumentów o złej jakości, na przykład faksów, czy zeskanowanych w niskiej rozdzielczości. Wzrost dokładności rozpoznawania w wypadku takich dokumentów waha się od 15 do 30 procent. Można podłączyć do FineReadera słownik Microsoft Worda, co pozwoliło na lepsze rozpoznawanie rzadko słów. W wersji 8.0 wprowadzono algorytmy przygotowane z myślą o dokumentach sfotografowanych aparatem cyfrowym. Technologia adaptywnego rozpoznawania obrazów rozwiązuje problemy związane z niewłaściwym oświetleniem, brakiem ostrości czy informacji o rozdzielczości. Na szczególną uwagę zasługuje funkcja prostowania wierszy (np. na fotografii wiersze znajdujące się blisko krawędzi są z reguły wygięte w łuk). Warto jeszcze wspomnieć o trybie szybkiego rozpoznawania, przydatnego w prostych i czytelnych dokumentach, a dwuipółkrotnie skracającego czas rozpoznawania. Rozpoznawanie rzutów. Kolejną ciekawą nowinką jest Abbyy Screenshot Reader, narzędzie do przechwytywania obrazu z monitora i natychmiastowego rozpoznawania zawartego w nim tekstu. Przydaje się w różnych sytuacjach: rozpoznawania tekstu z plików nieobsługiwanych przez FineReadera ( animacji Flash), okien komunikatów o błędach czy menu różnych programów. Narzędzie przechwytuje cały ekran lub tylko wskazany przez użytkownika obszar.
PROCES WYCZYTYWANIA TEKSTU ZE ZDJĘĆ. Uruchom finereadera. Następnie wybierz polecenie „Scan & Read”( slajd 3, zdjęcie nr 1). Pojawi się opcja wyboru sposobu odczytania dokumentu tekstowego. „From scanner” oznacza bezpośrednio ze skanera, zaś „from file” z pliku w formacie graficznym znajdującym się w komputerze. Wybieramy na przykład „from file”( slajd 13, zdjęcie numer 1).Wybieramy ścieżkę dostępu do pliku graficznego ( slajd 13, zdjęcie 2) Następnie pojawia się plansza z wyborem języka w którym dokument ma być skanowany. Wybieramy opcje „polish”(slajd 13, zdjęcie nr 3), ponieważ skanujemy dokument w języku polskim. Dokument jest skanowany. Wczytanie dokumentu i jego obróbka w programie finereader
Zdjęcie nr 1 Zdjęcie nr 2 Ilustracje do fineraedera Zdjęcie nr 2 Zdjęcie nr 3
Obróbka tekstowa w finereaderze, poprawa błędów i zapis zeskanowanego tekstu. Po przeskanowaniu pokazuje się komunikat o ilości błędów występujących podczas odczytu dokumentu, Możemy wybrać opcję „few errors”( slajd 15, zdjęcie nr 1), która dopuszcza niewielką ilość błędów przed zapisem tekstu w edytorze tekstowym lub wybrać opcję „a lol of errors” i rozpocząć półautomatyczne poprawianie błędów, począwszy od wybrania metody skanowania tekstu („rescan”), aż po ponowne wyczytywanie ( „reread”). My jednak zajmiemy się metodą „few errors”. Po jej wybraniu pojawia się plansza z pytaniem: „Czy chcemy ręcznie poprawić wyczytany tekst?”( slajd 15, zdjęcie nr 2). Jeżeli wybierzemy „yes” zaczniemy ręcznie poprawiać tekst ( slajd 16,zdjęcie nr 1). Jeżeli zaś wybierzemy „no” ukarze nam się lista edytorów tekstowych w których możemy zapisać nasz tekst. Wybieramy na przykład Microsoft Word.
Zdjęcie nr 1 Ilustracje do fineraedera Zdjęcie nr 2
Ilustracje do fineraedera Zdjęcie nr 1Zdjęcie nr 2
Końcowe czynności Obserwacja uczniów i ewentualne uwagi dotyczące programu finereader. Dopilnowanie, aby uczniowie bezpiecznie wyłączyli komputery i pozostawili po sobie utrzymane w porządku stanowiska pracy. Strony internetowe z których można pobrać wersję „trial” programu finereader: 0Edition%208.0%20PL.html ml