ZPDView

Diese Seite widmet sich ZPDView, einem Wörterbuchprogramm für die „alten” Zaurus-Modelle von Sharp (die, die noch nicht unter Linux liefen). Diese Modelle gibt es leider nur in Japan zu erwerben, und deshalb läuft die Bedienung auch allein in Japanisch.

Für die, die das nicht abschreckt – wie mich zum Beispiel –, der bekommt preiswert einen sehr leistungsfähigen PDA. Ich habe mir Mitte diesen Jahres das Modell MI-E1 zugelegt – und bin damit überaus zufrieden. Wer nähere Informationen über das Modell haben will, kann sich auf ezaurus.com mal umschauen - aber auch diese Seite ist leider nur in Japanisch verfügbar. Alles in allem kann der E1 alles, was man von einem PDA erwartet – Termine verwalten, Texte erfassen (wahlweise auch über die eingebaute Tastatur), MP3s und Videos abspielen, eBooks anzeigen, und er dient – mittels ZPDView – als Wörterbuch.

In der aktuellen Version – 1.7 – kann ZPDView mit bis zu 60 Wörterbüchern oder Lexika im PDIC-Format umgehen. Neu in dieser Version ist neben Bugfixes eine Volltextsuche sowie die Möglichkeit, einen Großteil der Funktionen über die Tastatur zu erreichen – was gerade bei externen Tastaturen vorteilhaft ist.

Die ZAC-Datei steht hier zum Download bereit. Es handelt sich um eine Datei im Zaurus ArChive-Format, welches problemlos über die MORE Soft-Funktion des Zaurus installieren lässt.

Damit man auch die größeren CF-Karten mit ZPDView richtig ausnutzen kann, habe ich noch ein kleines Tool (WikiConv) geschrieben, welches die Daten des WikiPedia-Projektes, die es als tägliche Dumps hier zum Download gibt, in ein Format konvertiert, mit dem PDIC etwas anfangen kann. Das Tool ist ein „quick hack” und benötigte für die englische Version auf meinem Rechner (Athlon XP 2500+) gut 16 Stunden, um die one-line-Datei zu erzeugen. Also bitte schön geduldig sein.

Diese langer Dauer war wohl zum Teil auf die massiven Festplattenzugriffe zurückzuführen. Die nächste Version (0.02) behob dieses Manko und verringert die Zeit, die für die englische Version auf meinem System benötigt wurde, auf 8 Stunden. Außerdem ist auch die temporäre Datei nicht mehr so übermäßig groß – sie entspricht jetzt ungefähr der Größe der Wiki-SQL-Datei. Nachdem ich durch weitere Optimierungen den Zeitbedarf weiter schrumpfen ließ (2h für die englische Version, 8 Minuten für die deutsche) habe ich auch noch eine Sortieroption und weitere Zeichenkonvertierungen eingebaut. Das Ergebnis: Für das englische Dump-File benötigt die Version 0.04 bei mir nun 4:40h, dafür geht die Konvertierung mit PDIC aber wesentlich schneller. Außerdem werden deutlich weniger Fragezeichen in die Ausgabedatei geschrieben.

Ende Juli 2004 wurde das Datenformat der Wikipedia auf die UTF-8-Kodierung für Unicodes umgestellt, mit der diese Version von WikiConv jedoch nichts anfangen kann. Aus diesem Grunde gibt es eine neue Version hier zum herunterladen. In dem ZIP-Archiv ist auch gleich noch ein kleines Tool enthalten, mit dem die Unicode-Mappings editiert werden können. Die Version 0.06 bietet jetzt noch den Vorteil, dass die Diskussionsseiten gelöscht werden, bei Bedarf Tabellen komplett herausgenommen werden und dass bei einem mehrseitigen Beitrag (1/n) im ersten Artikel nicht mehr erscheint. Ab Version 0.07 werden Tabellen nicht mehr komplett gelöscht, sondern nur die Tags, mit denen der Zaurus nichts anfangen kann (hauptsächlich Formatierungen). Damit bleiben die Daten im Lexikon enthalten.

Die aktuelle Version verarbeitet die XML-Dumps, die seit Juli 2005 wohl die einzigen Dateien sind, die es von Wikimedia noch geben wird. In der aktuellen Fassung (0.10) werden auch englische und deutsche Wikipedia-Namespaces gefiltert, so dass die Daten für den Zaurus noch ein wenig kleiner werden.

Sollte jemand noch SQL-Dumps konvertieren wollen, gibt es hier noch die letzte Version, die mit den SQL-Dateien umgehen kann.

Wer Interesse an einem Zaurus hat, sollte sich auf zaurus.biojapan.de umsehen. Über Armin habe auch ich meinen Zaurus bekommen. Außerdem enthält die Seite sehr viele interessante Informationen über den Zaurus und seine Möglichkeiten.

Es folgen nun ein paar Screenshots vom aktuellen ZPDView:

ZPDView nach dem ersten Start
So sieht das Programm aus, wenn man die Eingabe auf Tastatur umgestellt hat.

Die Text Recognition vom Zaurus erkennt sogar mein Kanji-Gekragel, so dass auch ich diese beiden Schriftzeichen nachschlagen kann (alternativ könnte man auch Silben über die Tastatur eingeben).
Nachschlagen der beiden Kanji im WaDokuJT (mittlere Schriftgröße...

Anzeige der Treffer in großer Schrift.
Und nun die Treffer noch mal in der kleinsten Schriftart.

Nachschlagen der Kanji im Eijiro.
Man kann mit dem Stylus auch einfach Kanji/Worte markieren, um diese dann nachzuschlagen.

Nachschlagen der markierten Kanji im WaDokuJT.
Die verwendeten Wörterbücher (hier: DokuWa, die Umkehrung des WaDokuJT) sind auch richtig aktuell. :-)

Der Anfang der Trefferliste einer Volltextsuche nach den beiden Kanji.
Die Volltextsuche findet auch nicht immer etwas – z. B. wenn man sie zu früh abbricht, wie hier.

Es lassen sich mit ZPDView auch Lexika verwenden – hier eine recht aktuelle Version der Wikipedia-Enzyklopädie.
Dabei bietet sich die kleine Schriftart natürlich regelrecht an.

Da Wikipedia von Nutzern weiterentwickelt wird, finden sich auch umfangreiche Artikel zu aktuellen Themen.
Und zum Schluss noch ein Kanji, das mir in einem Ikebana-Buch über den Weg gelaufen ist.

Ahja, das war also gemeint...