Çarşamba, Haziran 7, 2023

DJVU

DJVU dosyası nedir?

“Déjà vu” olarak telaffuz edilen DjVu, özellikle metin, çizim, resim ve fotoğraf kombinasyonunu içeren taranmış belgeler ve kitaplar için tasarlanmış bir grafik dosyası formatıdır. AT&T Labs tarafından geliştirilmiştir.

Metin ve arka plan görüntülerinin görüntü katmanı ayrımı, aşamalı yükleme, aritmetik kodlama ve iki tonlu görüntüler için kayıplı sıkıştırma gibi birçok teknik kullanır.

DJVU dosyası sıkıştırılmış ancak yüksek kaliteli renkli görüntüler, fotoğraflar, metin ve çizimler içerebildiğinden ve bu nedenle daha az alana kaydedilebildiğinden, web’de e-Kitaplar, kılavuzlar, gazeteler, eski belgeler vb.

DjVu, PDF için üstün bir alternatif olarak derecelendirilebilir. DjVu ile ilişkili dosya uzantıları .DJVU veya .DJV’dir. DjVu, renkli belgeler için JPEG ve GIF gibi mevcut yöntemlerden yaklaşık 5 – 10 daha iyi ve [TIFF](‘den 3 – 8 kat daha iyi sıkıştırma oranları elde edebilir. /image/tiff/) siyah beyaz belgelerde. 25 MB’a kadar tam renkli olarak 300 DPI’da taranan belgeler 30 ila 100 KB’ye kadar sıkıştırılabilir. Benzer şekilde, Siyah beyaz belgeler 5 ila 30 KB’ye kadar sıkıştırılabilir. Ortalama bir HTML sayfası 50 KB’a kadar olabilir, bu nedenle bu belgeler net olarak sorunsuz bir şekilde yüklenebilir.

Kısa Tarih

DjVu teknolojisi AT&T laboratuvarlarında Yann LeCun, Léon Bottou tarafından geliştirilmiştir. A9on_Bottou), Patrick Haffner ve Paul G 1996’dan 2001’e kadar. DjVu dosya formatı, en sonuncusu 2005’ten olmak üzere çeşitli revizyonlardan geçti.

Sürüm Yayın tarihi Notlar
1–19 1996–1999 Bunlar geliştirme sürümleridir.
20 Nisan 1999 Tek sayfa, Çoklu sayfa formatına dönüştürüldü.
23 Temmuz 2002 CID parçası
24 Şubat 2003 LTAnno yığın
21 Eylül 1999 Dolaylı depolama formatı değiştirildi. Metin arama katmanı eklendi.
22 Nisan 2001 Sayfa yönü, renkli JB2
25 Mayıs 2003 NAVM öbeği. DjVu yer imleri için destek eklendi.
26 Nisan 2005 Metin/satır açıklamaları

DjVu Dosya Biçimi

DjVu belgeleri IFF85 dosyalarıdır. Yapı, bilgileri bir DjVu dosyasında tutan bir kapsayıcı hiyerarşisi sağlar. Bu kaplara “Parçalar” da denir. Yığın türü ve Yığın Kimliği, yığının nasıl kullanıldığını açıklar. IFF yapısı tarafından takip edilen 4 baytlık bir başlık vardır. Bir DjVu dosyasının ilk dört baytı 0x41 0x54 0x26 0x54’tür. Bu bölüm, çeşitli DjVu belgeleri türlerini ve bunları oluşturan karşılık gelen parçaları ele almaktadır.

Yığın Kimliği Kullanım
FORM İkincil tanımlayıcı olan FORM öbeğinin ilk dört veri baytına sahip bileşik yığın.
FORM:DJVM Çok sayfalı bir DjVu belgesi. DIRM yığınını içeren bileşik yığın.
FORM:DJVU Tek sayfa DjVu belgesi. Bir djvu belgesinde bir sayfa oluşturan parçaları içeren bileşik yığın.
FORM:DJVI INCL öbeği aracılığıyla dahil edilen bir “paylaşılan” DjVu dosyası. Paylaşılan ek açıklamalar ve şekil sözlüğü.
FORM:THUM Gömülü küçük resimler olan TH44 parçalarını içeren bileşik yığın.
DIRM Çok sayfalı belgeler için sayfa adı bilgisi.
NAVM Yer imi bilgisi
ANTa, ANTz Hem ilk görünüm ayarları hem de yer paylaşımlı köprüler, metin kutuları vb. dahil ek açıklamalar.
TXTa, TXTz Unicode Metin ve düzen bilgileri.
Djbz Paylaşılan şekil tablosu.
Sjbz BZZ, maskeyi depolamak için kullanılan sıkıştırılmış JB2 bitonal verileri.
FG44 IW44 verileri ön planı depolamak için kullanılır
BG44 IW44 verileri arka planı depolamak için kullanılır
TH44 IW44 verileri, gömülü küçük resimleri depolamak için kullanılır
Bir filigranı kaldırmak için WMRM
FGbz Renkli JB2 verileri. Karşılık gelen Sjbz parçasındaki her biri için bir renk (blit veya şekil?) sağlar.
BİLGİ Bir DjVu sayfası hakkında bilgi
INCL Dahili bir FORM:DJVI öbeğinin kimliği.
BGjp JPEG kodlu arka plan
FGjp JPEG kodlu ön plan
Smmr G4 kodlu maske

DJVU Sıkıştırma

Tek görüntü birçok farklı görüntüye bölünür ve ardından her görüntü ayrı ayrı sıkıştırılır. Bir DjVu dosyasının oluşturulması için görüntü önce arka plan, ön plan ve maske görüntüsü olmak üzere üç görüntüye ayrılır. Tipik olarak arka plan ve ön plan görüntüleri daha düşük çözünürlüklü renkli görüntülerdir; ancak maske görüntüsü daha yüksek çözünürlüklü bir görüntüdür ve genellikle metin burada depolanır. Ayırma işleminden sonra, ön plan ve arka plan görüntüleri dalgacık tabanlı sıkıştırma algoritması IW44 ile sıkıştırılırken, maske görüntüsü JB2 adı verilen başka bir yöntem kullanılarak sıkıştırılır.

JB2 kodlama yöntemi, belirli bir yazı tipindeki bir karakterin birden fazla oluşumu gibi sayfadaki aynı şekilleri tanımlayarak metin görüntüsündeki fazlalığın çoğunu ortadan kaldırır. JB2 önce benzer şekiller arasındaki fazlalıktan yararlanarak her benzersiz şeklin bit eşlemini kodlar. Ardından, her bir şeklin sayfada göründüğü konumları kodlar. Hem JB2 hem de IW44, ZP kodlayıcı adı verilen ve Shannon sınırının birkaç yüzdesi içinde kalan fazlalıkları sıkıştıran yeni bir uyarlanabilir ikili aritmetik kodlayıcı türüne güveniyor. ZP kodlayıcı uyarlanabilir ve diğer yaklaşık ikili aritmetik kodlayıcılardan daha hızlıdır.

Referanslar

Önceki İçerikDNG
Sonraki İçerikHDR

BENZER YAZILAR

Araştırmacılara Göre Bir Android Akıllı Telefonun Parmak İzi Güvenliğini Aşmak İçin Yalnızca 15 Dolarlık Bir Devre Kartı Alır

Android akıllı telefonlardaki parmak izi sensörleri, bu taşınabilir teknoloji parçalarına muhtemelen en yaygın eklemedir ve tek bir parmağın veya başparmağın yerleştirilmesinin ahize sahibinin cihaza...

BWP

.bwp dosyası nedir? Bir BWP dosyası, BuRg3r programlama dilinde oluşturulan bir web sayfası komut dosyasıdır. BuRg3r’ye özgüdür ve BuRg3r kaynağının şu şekilde ayrılmış bölümleriyle HTML kodu içerebilir. BuRg3r, Fluffy...

Güneş ÜlkesiTOMMASA CAMPANELLA

KİTABIN KONUSU : Güneş ülkesinde dile getirilen konu; toplumsal bir düzen düşüncesidir. İşte bu kitap bu toplumsal düzeni dile getirmektedir. Yazar temel olarak bu...

Zeynep Irgat Kimdir – Zeynep Irgat Biyografisi

Zeynep Irgat Kimdir - Zeynep Irgat Resimleri - Zeynep Irgat Biyografisi - Zeynep Irgat Hakkında    Zeynep Irgat (d. 1954,İstanbul) Sinema ve Tiyatro oyuncusu. Çok tanınmıyor olmakla...

Hepsinden Acı / Halit Ziya UŞAKLIGİL

KİTABIN ADI: HEPSİNDEN ACIKİTABIN YAZARI: HALİT ZİYA UŞAKLIGİLYAYIN EVİ VE ADRESİ : İNKILAP KİTABEVİBASIM YILI: 1984KİTABIN KONUSU:‘Hepsinden Acı’ içinde kısa hikayelerin oldugu bir kitaptır....

Kadir İnanır Kimdir – Kadir İnanır Biyografisi

Kadir İnanırın hayatı, Kadir İnanırın biyografisi, Kadir İnanır hakkında bilgi  15 Nisan 1949'da Ordu'da doğan Türk Sineması'nın büyük oyuncularından Kadir İnanır, oyunculuk hayatına foto-roman'lar ile...

POPÜLER YAZILAR

Gigabyte, 600 ve 700 Serisi Anakartlarına “Yeni Nesil Intel Masaüstü CPU” Desteği Ekliyor

Gigabyte, 600 ve 700 serisi anakartları için Intel'in yeni nesil masaüstü CPU desteği ekleyen yeni bir BIOS güncellemesini sessizce yayınladı. Gigabyte 600 ve 700 Serisi...

Apple AR Kulaklığını Pazartesi Günü Açıklayacak, Ancak Cihaz Ekim’de Seri Üretime Gireceğinden Lansman Aylar Sürebilir

Apple'ın merakla beklenen AR Kulaklığını Pazartesi günü WWDC etkinliğinde piyasaya sürmesi bekleniyor. Cihaz bir süredir söylenti değirmeninde dinlendi ve birkaç gecikmeden sonra, kulaklık nihayet...

Gmail Doğrulama Rozetlerini hatırlıyor musunuz? Dolandırıcılar Onlardan Yararlanmanın Bir Yolunu Buldu

Google, insanların her e-posta aldıklarında güvende olmalarını sağlamanın çeşitli yollarını araştırmaktadır. Şirket, aşağıdakiler de dahil olmak üzere çeşitli önlemler aldı: yakın zamanda duyuruldu İleti...

Apple’ın 12 Çekirdekli ‘X1’ Yonga Setli AR Kulaklığı, Yeni Benchmark Sızıntısında M2 Max’ten Daha Hızlı Performans Gösteriyor, Ama Ne yazık ki Skorlar Sahte

SoC'nin X1 olarak adlandırıldığını ortaya çıkaran en son kıyaslama sızıntısını duymak bizim için şaşırtıcıydı. 8 çekirdekli bir CPU yerine liste, M2 Max'ten daha yüksek...