Skan PDF a „normalny” PDF to nie to samo
W potocznym języku wszystko jest „PDF-em”, ale technicznie to mogą być dwa zupełnie różne światy. PDF z edytora (Word, LibreOffice, system EZD) ma zwykle tekst, który da się zaznaczyć, skopiować, przeczytać czytnikiem ekranu i przeszukać. Skan PDF to najczęściej jedna lub kilka stron zapisanych jako obraz – czyli coś jak zdjęcie kartki, tylko w kontenerze PDF.
Jeżeli dokument jest w formie obrazu, to użytkownik nie może łatwo wyszukać w nim informacji, powiększyć go bez utraty czytelności, ani sensownie skorzystać z technologii asystujących. To właśnie dlatego skany są tak często wskazywane jako problem w kontekście dostępności cyfrowej. Temat wymogów omawiam szerzej we wpisie BIP na WordPress a ustawa o dostępności cyfrowej i WCAG 2.1.
Czy można publikować skany PDF w BIP?
W praktyce skany w BIP się pojawiają i czasem są trudne do uniknięcia (np. dokument podpisany odręcznie, dokument otrzymany od innej instytucji tylko w formie skanu). Natomiast sam fakt, że „to jest skan”, nie rozwiązuje problemu dostępności.
Najbezpieczniejsze podejście jest takie: jeżeli publikujesz skan, zapewnij równolegle wersję dostępną. Czyli taką, którą da się odczytać czytnikiem ekranu i przeszukać. W zależności od sytuacji może to być:
– ten sam plik po OCR i poprawnym oznaczeniu (tagowaniu),
– dodatkowy plik w wersji tekstowej (np. PDF z edytora),
– treść dokumentu opublikowana jako HTML na stronie BIP, a skan jako „załącznik dowodowy”.
To podejście ma jeszcze jedną zaletę: ogranicza liczbę sytuacji, w których użytkownik musi domyślać się, co jest w dokumencie. A to jest dokładnie ten typ problemów, który potem wraca w wynikach kontroli i monitoringu dostępności.
Hej! Potrzebujesz uruchomić BIP?
Dlaczego skany PDF są jednym z najczęstszych błędów w BIP?
Skan jako obraz powoduje całą kaskadę problemów. Najpierw dostępność: czytnik ekranu nie ma czego czytać, bo nie ma tekstu. Potem użyteczność: użytkownik nie wyszuka słowa, nie skopiuje fragmentu, nie zaznaczy paragrafu. A na końcu dochodzi praktyka urzędowa: gdy przychodzi prośba o informację publiczną, pracownik i tak musi „ręcznie” odszukać treść, bo nie da się szybko przeszukać archiwum skanów.
Jest też drugi, bardzo częsty problem: skany bywają publikowane jako „pełne” dokumenty, a w środku zostają dane, które nie powinny trafić do internetu. To dotyczy np. umów, protokołów, pism z danymi wrażliwymi. Wtedy temat dostępności miesza się z tematem RODO. Jeśli chcesz to poukładać, masz do tego osobny wpis: Czy dane osobowe mogą być publikowane w BIP zgodnie z RODO?.
Warto dodać jeszcze jedną rzecz: skany utrudniają utrzymanie porządku w BIP. Gdy dokument jest obrazem, dużo trudniej go poprawić, zaktualizować, zrobić nową wersję „bez straty jakości”. Dlatego przy dłuższych procesach (regulaminy, statuty, procedury) skany często prowadzą do chaosu wersji. Ten temat łączy się naturalnie z wpisem Rejestr wersji dokumentów w BIP na WordPress.
Czemu „wtyczka dostępności” nie naprawi skanów?
To ważne, bo wiele jednostek próbuje iść na skróty. Nakładka lub panel dostępności może powiększyć tekst albo zmienić kontrast strony, ale nie zamieni obrazu w tekst. Jeżeli w załączniku jest skan, to żadna wtyczka nie sprawi magicznie, że czytnik ekranu zacznie go rozumieć. Właśnie dlatego „ładny przycisk dostępności” często daje fałszywe poczucie bezpieczeństwa.
Jeżeli chcesz, możesz to spiąć linkiem do wpisu Czy w BIP na WordPress można używać wtyczek dostępności?, bo tam dobrze widać różnicę między „dodatkiem do interfejsu” a realną pracą nad treścią.
Jak poprawnie publikować dokumenty w BIP zamiast skanów?
Najlepsza praktyka jest banalna: publikuj dokumenty z „źródła”, czyli z edytora lub systemu, w którym powstały. Jeżeli dokument został napisany w Wordzie, to idealnie jest wygenerować PDF bezpośrednio z pliku (eksport), a nie drukować i skanować. Jeśli dokument przechodzi przez podpis elektroniczny lub system obiegu dokumentów, najczęściej da się uzyskać wersję, która nadal zawiera tekst.
Jeżeli skan jest nieunikniony (bo np. masz tylko papierowy oryginał), to minimum jest takie, żeby zrobić OCR i doprowadzić plik do stanu, w którym tekst da się zaznaczyć i odczytać. W BIP-ach problemem nie jest sam OCR, tylko to, że bywa robiony „byle jak”: bez sprawdzenia błędów, bez porządnej struktury, bez tagów, bez tytułu dokumentu. A to nadal potrafi polec w audycie.
Dodatkowo warto nazywać pliki sensownie. Zamiast „scan_001.pdf” lepiej „zarzadzenie_12_2025_regulamin_rekrutacji.pdf”. To brzmi banalnie, ale naprawdę wpływa na to, czy użytkownik (i pracownik jednostki) w ogóle coś znajdzie. Wpis o typowych błędach masz tutaj: Najczęstsze błędy przy tworzeniu BIP na WordPress i jak ich uniknąć.
Jak rozpoznać, że PDF jest skanem i będzie problem?
To proste i warto to uczyć redaktorów BIP. Otwórz plik i spróbuj zaznaczyć fragment tekstu myszką. Jeżeli nie da się zaznaczyć ani jednego słowa, a powiększanie powoduje „rozjeżdżanie się” liter jak w zdjęciu, to najprawdopodobniej masz skan. Drugim testem jest wyszukiwarka w PDF: jeżeli wpisujesz słowo, które widzisz na ekranie, a program nic nie znajduje, to również sygnał ostrzegawczy.
W BIP to jest krytyczne, bo skany bardzo szybko rosną w liczbę, a później trudno je „odkręcić”. Jeśli instytucja ma setki załączników w postaci obrazów, to poprawa dostępności przestaje być prostą korektą i robi się z tego poważny projekt porządkowy.
Podsumowanie
Skany PDF w BIP to jeden z najczęstszych powodów, dla których strony podmiotowe wypadają słabo w audytach dostępności. Sam plik „PDF” nie oznacza jeszcze dokumentu dostępnego – jeśli to obraz, to dla wielu użytkowników jest praktycznie nieczytelny. Jeżeli skan jest nieunikniony, trzeba zadbać o wersję dostępną: OCR, poprawną strukturę i sensowną publikację.
Najprościej jest temu zapobiegać: publikować dokumenty z edytora lub systemu obiegu, zamiast drukować i skanować. To oszczędza czas, zmniejsza ryzyko problemów z WCAG i ogranicza „płacz po czasie”, kiedy ktoś odkrywa, że dostępność BIP jest tylko pozorna.
Źródła