„Präreformatorisch” bezieht sich nicht etwa auf die „Rechtschreibreform“ von 1996, sondern auf die von 1901. Es geht also um Texte aus dem 19. Jahrhundert mit wenig standardisierten Schreibweisen. Kein Rechtschreibprogramm der Welt kann die zuverlässig richtig trennen. Dabey ist in eBooks auf der kleinen Lesefläche eine durchgehende richtige Trennung besonders wichtig. Im Umfeld von TeX hat Franklin Mark Liang an der Universität von Stanford, Kalifornien, einen Algorithmus entwickelt, der aus einer gegebenen Wortliste Trennmuster abzuleitet, welche alle möglichen Trennstellen zuverlässig findet und falsche ausschließt (Programm patgen). Also braucht es möglichst umfangreiche Wortlisten mit bereits markierten Trennstellen. Im DANTE e.V. gibt es eine recht aktive Trennmustergruppe, die solche Listen vorhält. Die allgemeine Wortliste umfaßt mehr als 400.000 Worte und Schreibweisen. Trennstellen sind in verschiedenen Feldern für die traditionelle wie auch die reformierte Rechtschreibung markiert. Daneben es spezielle Listen für Arzneiwirkstoffnamen und seit kurzem auch eine Liste „pre-1901”. Mit einem einfachen Shell-skript kann man aus seinem Text die Worte herausfiltern, die noch in keiner der Listen enthalten ist. Die kann man dann in die Liste eintragen, die Trennstellen markieren, neue Trennmuster generieren und dann mit weiteren Shell- und Perl-Skripten unter Zuhilfenahme von TeX-Mechanismen in das XHTML seines eBooks an allen möglichen Trennstellen „weiche“ Trennstriche (soft hyphens) einfügen. http://projekte.dante.de/Trennmuster