]> www.wagner.pp.ru Git - fiction/Kate-the-Empress.git/blobdiff - Tex2fb2
work on fb2 formatting
[fiction/Kate-the-Empress.git] / Tex2fb2
diff --git a/Tex2fb2 b/Tex2fb2
old mode 100644 (file)
new mode 100755 (executable)
index 2fe0580..2d644df
--- a/Tex2fb2
+++ b/Tex2fb2
@@ -1,4 +1,5 @@
-#!/usr/bin/perl
+#!/usr/bin/perl -CDS
+use utf8;
 # char-level modes
 my $poetry = 0;
 my $verbatim = 0;
@@ -21,6 +22,7 @@ while (<F>) {
 close F;
 
 my $header =1;
+LINE:
 while (<>) {
 $environ = undef;
 if (/\\(begin|end){(\w+)}/) {
@@ -40,25 +42,41 @@ if (/\\(begin|end){(\w+)}/) {
        }
 }
 next LINE if $header;
-if (/^$/ && $environ && $buffer) {
+if ((/^$/ || $environ) && $buffer) {
 #output on empty line (p or stanza) depending on poetry mode
        add_to_section(tag($buffer,$poetry?"stanza":"p"));
        $buffer="";
 }
 next LINE if $environ;
 # Section headings
-if (/\\(part|chapter|section|subsection|subsubsection){(.*)}/) {
+if (/\\(part|chapter|section|subsection|subsubsection)\*?{(.*)}/) {
+       if ($buffer) {
+               add_to_section(tag($buffer,$poetry?"stanza":"p"));
+               $buffer="";
+       }
        pushsection($1,$2);
+       next LINE;
+}
+if (/\\vspace{/) {
+       add_to_section("<empty-line />");
+       next LINE;
 }
 #normal mode: 
 if (!$verbatim) {
 #strip TeX comments 
 s/([^\\])%.*$/$1/;
+s/^%.*$//;
+# strip \sloppy
+s/\\sloppy\s+//g;
+s/\\sloppy{}//g;
+s/\\sloppy([^\w])/$1/g;
 #replace TeX ligatures ~ --- << >> \% with appropriate unicode symbols
 s/~/\xA0/g;
 s/---/-/g;
 s/<</«/g;
 s/>>/»/g;
+s/\\%/%/g;
+s/\\dots/\x{2026}/g;
 }
 #replace ' and " with entities
 s/&/&amp;/g;
@@ -78,6 +96,7 @@ if ($poetry) {
 }
 if ($buffer) {
        add_to_section(tag($buffer,"p"));
+       $buffer="";
 }
 
 while (@sections) {
@@ -128,5 +147,6 @@ sub pushsection {
 
 sub tag {
        my ($content,$name) = @_;
+       return "" if ($content eq "\n");
        return "<$name>$content</$name>";
 }