-
71. Data: 2018-09-25 19:46:18
Temat: Re: Jak przechować dokumenty
Od: Jarosław Sokołowski <j...@l...waw.pl>
Pan Mateusz Viste napisał:
>> To coś zaszalałeś z jakością JPG.
>> Daję 50% i nie widzę różnicy w jakości.
>
> To "50%" chyba różnie jest interpretowane w różnych programach. Niemniej
> wykonałem test. Dokument źródłowy to strona z katalogu handlowego:
>
> JPG z jakością "50": 140 KiB
> 4 bitowe PNG: 84 KiB
>
> Przy tej jakości wersja JPG jest co prawda czytelna ale tekst wygląda
> paskudnie - literki jakby ktoś po nich brudnym paluchem mazał. A mimo
> tego JPG jest niemal 2x cięższy od (4-bit) PNG. Ok, zdjęcia lepiej
> wychodzą na JPG, ale w kontekście archiwizacji dokumentów interesuje mnie
> wyłącznie tekst, a ten znacząco lepiej wychodzi przy PNG, przy mniejszym
> rozmiarze.
>
> https://imgpile.com/images/njH0hP.jpg
> https://imgpile.com/images/njHWz1.png
No bo JPEG jest kompresją strtną, w której traci się akurat te informacje,
jakie są bardzo ważne w obrazie zapisanej kartki papieru, a w przypadku
fotografii z typowym landszaftem są nieistotne.
Żeby nie być w tyle w tych wyścigach, wróciłem do swojego pliku ze
skanem z poprzedniego przykładu (PNG 188798 bajtów). Pełną paletę
kolorów zamieniłem na indeksowaną. Przy palecie 256 kolorów plik PNG
ma 66044 bajty, a przy 16 kolorach -- 34245 bajty. Różnice wizualne
są ledwie dostrzegalne, a różnica w czytelności zerowa (to ostatnie
ma pełne uzasadnienie w fizjilogii widzenia).
Jarek
--
Na wysokiej cyrli cosik się tam cyrni,
Cy to kupa gnoja, cy dziewczyna moja?
-
72. Data: 2018-09-25 20:20:50
Temat: Re: Jak przechować dokumenty
Od: Mateusz Viste <m...@n...pamietam>
On Tue, 25 Sep 2018 19:46:18 +0200, Jarosław Sokołowski wrote:
> No bo JPEG jest kompresją strtną,
I dlatego nie należy jej stosować pisząc na usenecie. Wcina litrki.
> w której traci się akurat te informacje,
> jakie są bardzo ważne w obrazie zapisanej kartki papieru, a w przypadku
> fotografii z typowym landszaftem są nieistotne.
Sądzę że to jest dla wszystkich wypowiadającym się w tym wątku oczywiste.
Odpowiadałem jednak na teorię przedpiścy, jakoby kompresja ta była
niezauważalna ("nie widzę różnicy").
> Żeby nie być w tyle w tych wyścigach, wróciłem do swojego pliku ze
> skanem z poprzedniego przykładu (PNG 188798 bajtów). Pełną paletę
> kolorów zamieniłem na indeksowaną. Przy palecie 256 kolorów plik PNG ma
> 66044 bajty, a przy 16 kolorach -- 34245 bajty. Różnice wizualne są
> ledwie dostrzegalne, a różnica w czytelności zerowa (to ostatnie ma
> pełne uzasadnienie w fizjilogii widzenia).
Ha, skusił się jednak na te 4 bit. To jednak pięciokrotne zmniejszenie
pliku, przy zachowaniu pełnej jego czytelności. Z tym że ja i tak wolę
kolory odrzucić, bo przy 4 bpp kolorowe dokumenty wyglądają czasem nieco
komicznie, a przy 16 tonach w pełni zachowują swój pierwotny, poważny...
ton.
Mateusz
-
73. Data: 2018-09-25 22:13:30
Temat: Re: Jak przechować dokumenty
Od: Jarosław Sokołowski <j...@l...waw.pl>
Pan Mateusz Viste napisał:
>> No bo JPEG jest kompresją strtną,
> I dlatego nie należy jej stosować pisząc na usenecie. Wcina litrki.
Kompresja stratna redundantnych kanałów informacji to jest jeszcze inny
przypadek. Nie wcina informacji przekazywanej.
>> w której traci się akurat te informacje, jakie są bardzo ważne
>> w obrazie zapisanej kartki papieru, a w przypadku fotografii
>> z typowym landszaftem są nieistotne.
>
> Sądzę że to jest dla wszystkich wypowiadającym się w tym wątku
> oczywiste. Odpowiadałem jednak na teorię przedpiścy, jakoby
> kompresja ta była niezauważalna ("nie widzę różnicy").
Mam wrażenie, że do publicznej świadomości prawda ta dociera słabo.
Uważa się powszechie, że JPEG, to taki format, który oszczędza dużo
bajtów, a informacji zżera mało. Tymczasem ogrom strat widać na dwóch
przeciwstawnych biegunach. Jak trzeba przedstawić ostre szczegóły
(literki na przykład), albo gdy mamy pozornie jednolity kolor, który
jednak minimalnie zmienia się z jakimś gradientem. Błękit nieba
potrafi być paskudnie posiekany w plikach JPG.
>> Żeby nie być w tyle w tych wyścigach, wróciłem do swojego pliku ze
>> skanem z poprzedniego przykładu (PNG 188798 bajtów). Pełną paletę
>> kolorów zamieniłem na indeksowaną. Przy palecie 256 kolorów plik
>> PNG ma 66044 bajty, a przy 16 kolorach -- 34245 bajty. Różnice
>> wizualne są ledwie dostrzegalne, a różnica w czytelności zerowa
>> (to ostatnie ma pełne uzasadnienie w fizjilogii widzenia).
>
> Ha, skusił się jednak na te 4 bit. To jednak pięciokrotne zmniejszenie
> pliku, przy zachowaniu pełnej jego czytelności. Z tym że ja i tak wolę
> kolory odrzucić, bo przy 4 bpp kolorowe dokumenty wyglądają czasem nieco
> komicznie, a przy 16 tonach w pełni zachowują swój pierwotny, poważny...
> ton.
Indeksowanie na podstawie histogramu, to jednak zupełnie co innego niż
ślepe podzielenie całej gradacji na 4 albo 16 równomiernie temperowanych
półcieni. Zrobiłem teraz coś, czeego bym sam bez inspiracji z zewnątrz
nigdy nie zrobił. Zaindeksowałem plik na czterech poziomach *kolorów*
(czyli dwa bity na piksel). Granatowy wcześniej podpis stał się teraz
czarny, ale urzędowe pieczęcie barwę nadal mają czerwoną. Gdybym nie
wiedział, jaki kolor ma tusz w długopisie Starszy Specjalista, to bym
się nie poznał. Ogólnie jest nieźle -- tylko 18865 bajtów, co stanowi
niemal dokładnie 10% z pierwotnych 188798 bajtów. To jest bardzo budujące
spostrzęznienie (co dodam, by znowu się do nas jakiś nie czepiał, że
ględzimy nie w tematyce grupy).
Jarek
--
Więc chodź, pomaluj mój świat
na żółto i na niebiesko,
Niech na niebie stanie tęcza
malowana twoją kredką.
-
74. Data: 2018-09-25 22:52:24
Temat: Re: Jak przechować dokumenty
Od: Roman Tyczka <n...@b...no>
On Tue, 25 Sep 2018 22:13:30 +0200, Jarosław Sokołowski wrote:
> To jest bardzo budujące
> spostrzęznienie (co dodam, by znowu się do nas jakiś nie czepiał, że
> ględzimy nie w tematyce grupy).
Jak nie w tematyce? Przecież mowa o budowaniu archiwum dokumentów ;-)
Temat i odnoga wątku bardzo ciekawe, nie zamykajcie klawiatur :-)
--
pozdrawiam
Roman Tyczka
-
75. Data: 2018-09-26 08:40:20
Temat: Re: Jak przechować dokumenty
Od: Mateusz Viste <m...@n...pamietam>
On Tue, 25 Sep 2018 22:13:30 +0200, Jarosław Sokołowski wrote:
> Indeksowanie na podstawie histogramu, to jednak zupełnie co innego niż
> ślepe podzielenie całej gradacji na 4 albo 16 równomiernie temperowanych
> półcieni.
Ja korzystam ze stałych palet 4- albo 16- tonowych. Wbrew intuicji, takie
podejście zapewnia (u mnie) lepsze wyniki niż pozwolenie mądremu
algorytmowi na dobranie samemu tonowej palety. W przypadku niektórych
dokumentów taki algorytm próbuje czasem na siłę zachować jakiś wąski
gradient, jeśli ten gradient występuje na względnie dużej powierzchni
dokumentu. Krawędzie liter mogą stać się wtedy wizualnie lekko
"postrzępione", tylko dlatego że algorytm chciał ładnie przedstawić
jakieś dwa obrazki czy loga z dokumentu. A mi zależy najbardziej na
ładnym tekście, nawet jeśli tekstu jest mniej jak grafiki. Dlatego
forsuję swoje (równomiernie rozłożone) palety.
> Zrobiłem teraz coś, czeego bym sam bez inspiracji z zewnątrz
> nigdy nie zrobił. Zaindeksowałem plik na czterech poziomach *kolorów*
> (czyli dwa bity na piksel). Granatowy wcześniej podpis stał się teraz
> czarny, ale urzędowe pieczęcie barwę nadal mają czerwoną. Gdybym nie
> wiedział, jaki kolor ma tusz w długopisie Starszy Specjalista, to bym
> się nie poznał.
Kiedy kilka(naście) lat temu testowałem różne kombinacje indeksowanie
kolorów, tonów i półcieni, moja pierwsza myśl to było właśnie budowanie
specyficznych kolorowych palet per dokument (wtedy to w ogóle bardzo
modne było - jedna paleta dla "web", inna dla worda, inna do zdjęcia z
wakacji, itd). Ta droga wydawała mi się wtedy najbardziej skuteczna,
mądra i w ogóle nowoczesna. Ale tu znów mądre algorytmy okazały się
przeszkodą dla czytelności tekstu. Przykład: zdarzało się że poszczególne
piksele na krawędziach liter nabierały lekkich kolorów (np. wokół
czarnego tekstu pojawiały się piksele ciemno-czerwone albo błękitne). A
to dlatego, że program nie miał już miejsca na zachowanie w palecie
takiej odcieni szarości która byłaby bliska oryginalnemu pikselowi, i
uznał że taki błękitny lepiej oddaje jasność oryginału niż np. ciemno-
szary.
Słowem - czasem kolorowe palety na podstawie histogramu wychodzą dobrze,
ale jednak często są wpadki. A ja lubię determinizm i gładką czcionkę, i
to udaje mi się otrzymać wyłącznie za pomocą równomiernie rozłożonych
palet tonowych (2- lub 4- bitowych, zależnie od złożoności materiału
początkowego). No i nie chcę też tracić czasu na analizę każdego
skanowanego dokumentu. Mam od lat jedną, uniwersalną procedurę i wiem że
jak zrobię skan to będzie wyglądał tak, jak tego oczekuję, i co najwyżej
mogę rzutem oka wybrać jeden z dwóch wariantów (2 bpp lub 4 bpp) do
zachowania.
Mateusz
-
76. Data: 2018-09-26 11:33:02
Temat: Re: Jak przechować dokumenty
Od: Jarosław Sokołowski <j...@l...waw.pl>
Pan Mateusz Viste napisał:
>> Indeksowanie na podstawie histogramu, to jednak zupełnie co innego niż
>> ślepe podzielenie całej gradacji na 4 albo 16 równomiernie temperowanych
>> półcieni.
>
> Ja korzystam ze stałych palet 4- albo 16- tonowych. Wbrew intuicji,
> takie podejście zapewnia (u mnie) lepsze wyniki niż pozwolenie mądremu
> algorytmowi na dobranie samemu tonowej palety.
Przyznam, że szesnastotonowa paleta ma swoje ograniczenia. Efekt będzie
dobry, gdy jakość oryginału jest odpowiednia. Biała kartka z napisami,
a nie jakiś stary poplamiony papier z niewyraźnym drukiem.
> Słowem - czasem kolorowe palety na podstawie histogramu wychodzą dobrze,
> ale jednak często są wpadki. A ja lubię determinizm i gładką czcionkę
Ja kierowany tymi samymi przesłankami całkiem odpuściłem sobie ładowanie
szesnastotonowych palet. Dla uniknięcia wpadek na składowisko jadę zawsze
z pełnym kolorem. Ale gdyby zaszła potrzeba, mogę nawet po kilku latach
coś skompresować.
Jarek
--
You load sixteen tons, what do you get
Another day older and deeper in debt
Saint Peter don't you call me 'cause I can't go
I owe my soul to the company store