Projekt: Hesla Jednoty bratrské/2010

Z Wikiverzity

Projekt: Hesla Jednoty bratrské – příprava Hesel pro rok 2010

Spolupodílí se[editovat]

  • Kychot: organizace celého projektu, editace, programování, databáze
  • Friedrich Reinhardt V.: manuskript pro překlad
  • Česká biblická společnost: Poskytnutí práv k použití českého ekumenického překladu (ČEP)
  • Mirek: převod prvního pololetí; autorská korektura
  • Jindra: převod druhého pololetí; autorská korektura
  • Slávek: PHP interface pro editaci; sazba v TeXu; obálka
  • Iny: závěrečná korektura
  • tiskárna J+H (tisk)
  • Jiří Vičík: zakomponování Hesel do konkordance ICASI bible

Pracovní adresáře[editovat]

Postup práce rozdělený na etapy (pracovní adresáře). Uvádím je důležitější soubory (milníky).

Do října roku 2008 probíhaly přípravy k tisku a tisk Hesel na rok 2009 a následně až do prosince probíhala jejich distribuce. Práce na Heslech pro rok 2010 začala letos se zpožděním až v únoru 2009.

w01-los-odt[editovat]

2009-02-06[editovat]

Uleožení původního německého manuskriptu v ODT.

  • Losungen2010.doc – manuskript i s předmluvou (vytvořený 2008-06-03, došel 2008-07-18), 144 stran formátu Letter (21.59 x 27.94 cm na výšku).
  • Losungen2010.odt – pův. dokument načten OpenOffice.org Writer v. 2.4.1 a uložen ve formátu ODT

w02-los-txt[editovat]

2009-02-06[editovat]

Extrakce textového souboru z ODT.

  • /los10odt-make, strip.pl, styles.pl – skriptíky, které z ODT extrahují text
  • /los10-03.txt – výsledný soubor (ukázka); mezi číslem a názvem knihy letos jsou mezery, tj. např. "5. Mose"

Je otázka, jestli to má smysl a jestli nestačí ODT (či původní DOC) soubor normálně exportovat jako textový. Původní myšlenka byla, že skripty pro další konverzi by mohly nějak využít formátování dokumentu k tomu, aby podle něj mohly lépe odlišit obsah. Současné skripty však této možnosti příliš nevyužívají, jen občas (např. k vyrušení kurzívy, která by se stejně ale při konverzy do plain textu ztratila).

w03-los-pre[editovat]

2008-02-06, 2008-02-19, 2008-02-20[editovat]

Konverze do formátu PRE

  • /herr.pl – odstraní zalomení řádek, způdobené přechodem na kurzívu v textu (hlavně u zvýrazněného slova Herr)
  • los10pre.pl – skript (417 řádek) se snaží vstupní textový soubor konvertovat do formátu PRE (ještě s drobnými chybami)
  • /los10make-pre – dělá menší meziúpravy a volá výše uvedené skripty
  • Výše uvedený skript skončí a vyhodí chybu pokaždé, když dojde k nějaké nesrovnalosti. Proto je nutné neustále vstupní textový soubor podle chybových hlášek opravovat tak dlouho, až skript proběhne bez chyby. Což znamená řádově asi tak 100 editací.
  • poslední verze los10-08.txt = los10-08g.txt je ta, ze které se už dá vygenerovat:
  • los10-09.pre – výsledný soubor ve formátu PRE (ukázka) – od Adventu se projevuje chyba, že odkazy na Perikopu Pr> jsou tam dvakrát

w04-los-pre[editovat]

2008-02-21[editovat]

Vygenerovaný soubor PRE ovšem obsahuje ještě množství dalších chyb, které je nutno opravit:

  • /los10-10.pre – po ruční editaci ze souboru los10-09.pre
  • /los10pre.pl – opravený skript
  • los10-11.pre – jeho výstup
  • los10-12.pre – ručně editovaný soubor

w05-los-hes[editovat]

2008-03-13 – 2008-03-14[editovat]

Překlad německých Losungen do českých Hesel

  • /hes10kni.tab – tabulka názvů biblických knih a zkratek v různých jazycích
  • /los10hes.pl – skript (453 řádků), který překonvertuje odkazy z německého souboru los10-13.pre do češtiny hes10-13.pre. Přitom ještě nutno zase vychytávat chyby ve vstupním souboru, takže postupně vznikají různé verze.
  • /mezerypryc.pl – skriptíček, který vyhodí mezery mezi číslem a názvem biblické knihy
  • /predigt.pl – skriptíček, který hodí odkazy na perikopy do zvláštního řádku
  • hes10-18.pre – prozatímní výsledek, jen české odkazy do bible bez veršů.

w06#old-hes-pre[editovat]

2008-03-14, 2008-03-19[editovat]

Tento adresář obsahuje postup, kde adresáře s biblickými texty obsahovaly drobné chyby (zdvojení mezer v textech).

  • /eku, /kra – adresáře s biblickými texty. Oproti loňsku je bylo nutné překonvertovat do utf-8
  • /hes10bib.pl – skript, který k odkazům dohledá příslušné verše z kralické nebo ekumenické bible. Tak, jak postupně hlásí různí chyby, se opět musí editovat vstupní soubory:
  • /hes10-20.pre – odkazy ještě bez veršů
  • /hes10-21.pre – už doplněné biblické verše
  • /hes10-22.pre – ruční editace v závislosti na chybách při cpaní do databáze (viz dále)
  • /hes10stru.sql – struktura MySQL databáze
    • comment – komentáře na koci dnů, výročí atd.
    • day – zvláštní dny, neděle, svátky, důležité dny, týdny: 'sunday','holiday','important','week'
    • dayname – názvy dnů v příslušných jazycích, jak se budou tisknout do hesel, např: 23. sobota
    • drittetext – tzv. třetí text z německých losungen
    • losung – biblické verše (hesla) spolu s odkazy do bible
    • reading – biblická čtení
    • song – sloky písní
  • /hes10pre-sql.pl – skript (321 řádek), který to z .PRE nacpe do MySQL databáze
  • los10-19.pre – dtto pro německé texty Losungen
  • los10pre-sql.pl – dtto pro německé texty Losungen
  • /make-bib+sql – dávkový soubor, který dobaví biblické verše a celé to nacpe do databáze

Tohle není teď potřeba, když to cpu do databáze:

  • /strip-swap.pl – vyhodí vše, co se nebude psát do Hesel a přehodí odkazy ze svátků a nedělí za následující den a perikopy dá do zvláštního souboru.
  • /hes10-21.pre – už prohozená biblická čtení na správné místo

w06-hes-pre[editovat]

2008-03-25, 2008-03-26[editovat]

Databáze s biblemi byly opraveny pomocí postupné aplikace příkazů (abych měl přehled o výskytu těch dvojmezer v textu, hlavně byly na koncích řádků):

grep -l '  ' *
perl -i.bak -pe 's/ +$//;' *
grep -l '  ' *
rm *.bak
perl -i.bak -pe 's/  / /;' *
grep -l '  ' *

(Vyskytla se i jedna trojmezera, doopravená ručně)

Dále se zhruba opakoval postup dle původního adresáře w06:

  • /eku, /kra – adresáře s biblickými texty – už vyházené ty opakované mezery
  • /hes10bib.pl – skript, který k odkazům dohledá příslušné verše z kralické nebo ekumenické bible. Tak, jak postupně hlásí různí chyby, se opět musí editovat vstupní soubory:
  • /hes10-20.pre – odkazy ještě bez veršů – zůstal stejný
  • doplnění veršů:
perl -w hes10bib.pl hes10-20.pre > hes10-21.pre
  • /hes10-21.pre – už doplněné biblické verše
    • skript hes10bib.pl má chybičku – při doplnění dvou veršů mezi ně dává navíc mezeru
  • Nyní je nutno udělat patch z proběhlých oprav ve starém adresáři:
cd ../w06#old-hes-pre
diff -C 2 hes10-21.pre hes10-22.pre > hes10patch-21-22.pre
cd ../w06-hes-pre
mv ../w06#old-hes-pre/hes10patch-21-22.pre .
patch -o hes10-22.pre hes10-21.pre hes10patch-21-22.pre
  • /hes10-22.pre – výsledný přepatchovaný soubor
  • /make-bib – dávkový soubor, který dobaví biblické verše

w07-sql[editovat]

2008-03-27[editovat]

Nacpu PRE soubory do MySQL databáze:

  • /hes10stru.sql – struktura MySQL databáze
    • comment – komentáře na koci dnů, výročí atd.
    • day – zvláštní dny, neděle, svátky, důležité dny, týdny: 'sunday','holiday','important','week'
    • dayname – názvy dnů v příslušných jazycích, jak se budou tisknout do hesel, např: 23. sobota
    • drittetext – tzv. třetí text z německých losungen
    • losung – biblické verše (hesla) spolu s odkazy do bible
    • reading – biblická čtení
    • song – sloky písní
  • /hes10pre-sql.pl – skript (321 řádek), který to z .PRE nacpe do MySQL databáze
  • los10-19.pre – dtto pro německé texty Losungen
  • los10pre-sql.pl – dtto pro německé texty Losungen
  • /make-sql – dávkový soubor, který to celé to nacpe do databáze

w08-php[editovat]

2009-03-13, 2009-03-19, 2009-03-20[editovat]

PHP skripty pro editování záznamů v databázi:

2009-03-27[editovat]

Testuji ta Hesla v té databáze na lokálním stroji. Vidím, že např. 2010-07-05 je heslo z 1.Královská 19,11-12 tak dlouhé, že se mi nevejde do pole varchar(255). Problém je v tom, že se obávám, že ta stará verze MySQL, kterou má Mirek, nemusí delší pole umět. Tak prozkoumávám Projekt: Hesla Jednoty bratrské/2009 a zjišťuji, že nakonec jsem to dělal na MySQL 5.0, se kterou už by problémy neměly být, takže to byla asi chyba.

Vracím se do adresáře w07:

w07-hes-sql[editovat]

2008-03-27[editovat]

– skoro celý den
  • hes10stru.sql – opravená struktura databáze
  • make-sql – batch soubor, který to tam nacpe voláním skriptů los10pre-sql.pl a hes10pre-sql.pl
  • hes10-23.pre – ručně editovaný soubor, editovány výskyty uvozovek
  • dále zjišťuji, že mám chyby v datech u hesel měsíců. Nechápu, jak to mohlo vloni projít. Takže ručně edituji soubory hes10-23.pre, los10-19.pre:
  • hes10-24.pre, hes10-20.pre – opravené soubory (datum před heslo měsíce)

w09-test[editovat]

Otestuji si, jak mi to půjde z té MySQL databáze zase tahat ven:

  • Odvyberu kralické překlady:
USE `hes10test`;
UPDATE `losung` SET `sel` = 0  WHERE `transl` = "kra";
  • hes10sql-dump.pl – jednoduché vydupování databáze do texťáku, podobného PRE
  • hes10sql-pre.pl – konverze do PRE
  • hes10sql-rannichvilky.pl – generování ranních chvilek
  • nakonec přehodím do XML - celkem to prošlo

w10-www[editovat]

2009-03-28[editovat]

Upload na WWW server:

Na WWW server byly poocí FTP nejdříve uploadovány PHP skripty. Pokud byla databáze ještě prázdná, hlásily chybu:

Heslo měsíce: 
Warning: mysql_num_rows(): supplied argument is not a valid MySQL result resource in /.../www/hesla-test/functions.php on line 54

Tu chybu by chtělo ošetřit.

Tabulky z lokální databáze vydumpovány (=exportovány) příkazem např:

mysqldump -uuživatel -pheslo hes10test > hes10test.sql

(velikost 663 KB) a poté importovány na WWW server s pomocí phpmyadmina:

Import byl úspěšně dokončen, bylo provedeno 88 dotazů.
Databáze: jbhes10test
Tabulka Záznamů Typ Porovnávání Velikost Navíc
comment 16 MyISAM utf8_czech_ci 3.2 KiB -
day 156 MyISAM utf8_czech_ci 11.6 KiB -
dayname 730 MyISAM utf8_czech_ci 32.1 KiB -
drittetext 365 MyISAM utf8_czech_ci 98.5 KiB -
losung 2 421 MyISAM utf8_czech_ci 424.1 KiB -
reading 1 844 MyISAM utf8_czech_ci 97.2 KiB -
song 63 MyISAM utf8_czech_ci 3.5 KiB -
Celem 7 tabulek 5 595 MyISAM utf8_czech_ci 670.2 KiB 0 B


w11-od_mirka[editovat]

2009-06-30[editovat]

  • U Mirka jsem si vydumpoval databázi Hesel, která editoval, do souboru hes10mirek1.sql (678 kB).

2009-07-18[editovat]

  • Vytvořil jsem databázi hes10mirek a importoval tam výše uvedený soubor. Po importu:
Databáze: jbhes10test
Tabulka Záznamů Typ Porovnávání Velikost Navíc
comment 16 MyISAM utf8_czech_ci 3.2 KiB -
day 156 MyISAM utf8_czech_ci 11.6 KiB -
dayname 730 MyISAM utf8_czech_ci 32.1 KiB -
drittetext 365 MyISAM utf8_czech_ci 98.5 KiB -
losung 2 428 MyISAM utf8_czech_ci 324.9 KiB -
reading 1 844 MyISAM utf8_czech_ci 97.2 KiB -
song 123 MyISAM utf8_czech_ci 17.0 KiB -
Celem 7 tabulek 5 662 MyISAM utf8_czech_ci 654.6 KiB 0 B
  • Lehce jsem databázi přehlédnul a zase exportoval do hes10mirek2.sql (celkem zbytečně, jen pro kontrolu)
  • Kontrolní dump dat z databáze:
./hes10sql-dump.pl > hes10-01.dump
  • generování souboru .PRE z databáze:
./hes10sql-pre.pl > hes10-01.pre
  • ladění skriptu hes10sql-pre.pl:
    • y>, m> (heslo roku a měsíce)
    • $intro
    • comment _>
  • Zdroj "2.Thessalonicher 2,16-17" má délku 24 znaků a nevešel se do pole 20 znaků, proto změněno losung.source=varchar(25)
  • nakonec:
./hes10sql-pre.pl > hes10-03.pre
  • Hledání chyb v hes10-03.pre a podle toho se ladí skript a opravují data přes PHP rozhraní v databázi
./hes10sql-pre.pl > hes10-04.pre
  • Zpěvníky:
    • EZ
    • EZD = Evangelický zpěvník Dodatek, Kalich 2007, ISBN: 978-80-7017-055-7
    • Svítá
    • ZCČSH = Zpěvník Církve československé husitské, Blahoslav v ÚCN Praha 1977
    • 2010-08-15 EZD 631,3+5
./hes10sql-pre.pl > hes10-05.pre
cp -p hes10-05.pre hes10-06.pre
emacs -nw hes10-06.pre
Query replace: '  ' -> ' ' Replaced 206 occurrences
Query replace: ' \n' -> '\n' Replaced 913 occurrences
  • Příště: generovat názvy měsíců do .PRE
perl -ne 'print if /2010$/; next if /^\#/; print' < hes10-06.pre > hes10-06.txt
oowriter hes10-06.txt
  • tisk archů pro autorské korektury
  • vysvětlivky hes10vys.txt
  • export databáze do hes10mirek3.sql


w12-aut_korekt[editovat]

2009-08-03 pondělí[editovat]

cca 21:00 – 23:00 hod:

Dostal jsem od Mirka korektury Hesel (na papíře). Letos jsem autorské korektury editoval v textovém souboru, nikoli v databázi (což byla zásadní chyba, přílišná unáhlenost):

cp -p  hes10-06.pre hes10-07.pre
emacs -nw hes10-07.pre
Query replace:  Kristus říká / Ježíš řekl (Replaced 11 occurrences)
Query replace:  Kristus řekl / Ježíš řekl (Replaced 2 occurrences)

Korektura leden - červen.

2009-08-04 úterý[editovat]

cca 10:00 – 10:45 – korektura červenec - prosinec

Poznámky:

  • 04-05: 1.Paralipomenon 29,12 K – nevejde se odkaz?
  • 09-12: dvě sloky – ošetřit rozdělovník

Další postup

  • phpmyadmin: Database hes10mirek has been copied to hes10-07, structure only
  • hes10pre-sql.pl
    • CHYBA: nenačítají se datumy. Proč? CHYBY ve skriptu hes10sql-pre.pl
      • při konverzi .pre ve fázi w11 za datumem není den v týdnu, ale tím to není
      • chybí tagy před názvy dnů, to už je ten problém; Doplním skriptíkem tagy_dnu.pl:
#! /usr/bin/perl -w 
while (<>) {
  s/^\d{1,2}\. (Pondělí|Úterý|Středa|Čtvrtek|Pátek|Sobota)/x>$&/;.
  s/^\d{1,2}\. Neděle/+>$&/;.
  print;
}
./tagy_dnu.pl hes10-07.pre > hes10-08.pre

Další chyby i při:

diff -B -b hes10-09.pre hes10-10.pre >  hes10-09-10.pre.diff
  • názvy týdnů a nedělí jsou před sobotou – protože mají chybně uvedený o 1 den menší datum – protože se ta chyba táhne už od /w09-test
  • tak jsem to opravil ručně na souboru hes10-09.pre
  • SR, CR a písně se neukládají do databáze (při běhu skriptu hes10sql-pre.pl to hází warningy) – no jasně, předtím tam byly tagy 1-> 2-> a teď SR> CR>
  • Ještě nejsou udělané písně!

Zkrátka ten skript hes10sql-pre.pl nefunguje obecně, jak jsem si původně naivně myslel.

ranni_chvilky[editovat]

Podadresář

los-xml[editovat]

Až se to bude dávat do XML:

  • los10xml.pl – loňský skript na generováni XML z PRE, délka 779 řádků – nepřehledný macek a musí mít PRE rozdělené po měsících.

prozatímní výsledek[editovat]

  • 2009-08-04 17:45 hes10-10.pre – poslední verse souboru PRE

w13-korekt_pro_inyse[editovat]

2009-09-18 pátek[editovat]

  • Úkol:
    • podle korektur od br. Vlasty Maláče opravit PRE
    • generovat předběžnou sazbu celých Hesel 2010 pro záverečnou korekturu pro Inyše

11:00 – 12:40[editovat]

  • Soubory:
    • ranni-chvilky2010_B.doc – soubor s vyznačenými korekturami od Vlasty. I když má extenzi .doc, není to Wordovský dokument, ale textový v kódování UTF-8, akorát má konce řádků CR+LF. Chyby vyznačeny ???
    • hes10-11.pre – editovaný soubor PRE
    • hes10-11.pre.diff – rozdílový soubor (opravené chyby)
  • Poznámky:
    • Skript na ranní chvilky – pro příště opravit:
      • význam nedělí – do závorek

12:40 – 18:30[editovat]

  • /pre.ori
    • hes10spl.pl – rozdělí soubor hes10-11.pre do měsíců
  • /pre
    • perl -i.ori -p evep.pl hes10??.pre – zkonvertuje odkazy na čtení (evangelium, epištola, žalm atd.) na 1., 2. a 3. odkaz
    • perl -i.bak pr-del.pl hes10??.pre – deletuje řádky s tagem Pr>
  • /pre.bak – záloha, protože /pre se bude ještě editovat
  • /tex – konverze do formátu TeX pro sazbu kartáčových archů pro konečnou korekturu (během toho může dojít zase k opravám zdrojových souborů PRE)
    • hes1001.tex – hes1012.tex – jednotlivé měsíce
    • .tex – další soubory (titulní strana, předmluva, vysvětlivky atd. až nakonec tiráž)
    • nakopírování loňských souborů /2009/w16-hinkovi-opr/vysazene/hes09adresy.tex .. hesla09.tex (kódování il2)
    • recode ISO-8859-2 *.tex
    • editace *.tex
    • recode ..ISO-8859-2 *.tex
    • pdfcsplain hesla10.tex

Mezitím instalace fontů a konfiguráků distribuce livetex do domácích adresářů:

  • ~/.texmf-config
  • ~/.texmf-var
  • Pár chyb (nepárové uvozovky), opravil a přeložil Sláva.
    • 271078 2009-09-18 16:10 hesla10.pdf
    • 227186 2009-09-18 16:11 hesla10-4na1.pdf (4up = 4x A6 na straně A4)

w14-sazba[editovat]

2009-10-15 pondělí[editovat]

Úkol:

  • Dostal jsem korektury od Jirky a od Inyše, tak je zapracovat do .pre a .tex souborů.

19:00 – 21:40[editovat]

  • Začátek a konec Hesel:
    • zkopíruji soubory *.tex
    • recode ISO-8859-2 *.tex
    • editace souborů adresíře, modl. stráže aj.

2009-10-16 úterý[editovat]

04:30 – 07:00[editovat]

Úkol:

  • Korektury .pre souborů
  • generování .tex souborů

Splněno.

18:00 – 20:15[editovat]

Úkol:

  • vygenerovat soubor perikop

Postup:

  • Nemám moc tušení, z čeho a jak jsem loni generoval ty perikopy. Tak zkouším:
./hes09strip-swap.pl /w13-korekt_pro_inyse/pre.ori/hes10-11.pre
  • Tak to mi udělá perikopy, jakoby to byly všechny epištoly. Už vzpomínám, jak jsem to vloni plácal dohromady z epištol a evangelií.
  • Aha, to bylo tím, že jsem tenkrát nějak zapomněl na tagy Pr>
  • Letos jsem je vyhodil skriptem /w13-korekt_pro_inyse/pre/pr-del.pl už si vzpomínám, takže tam někde je musím ještě mít
  • takže jen upravím hes09strip-swap.pl na hes10strip-swap.pl, budu hledat tagy Pr> a bude to jednoduché:
./hes10strip-swap.pl /w13-korekt_pro_inyse/pre.ori/hes10-11.pre
  • vygenerovaný soubor peri
  • takže konečný batch to řeší:
./hes10strip-swap.pl hes10-11.pre
./peri-txt-pre.pl peri > hes10per.pre
./hes10ptx.pl hes10per.pre
recode ..ISO-8859-2 *.tex hes10per.tex
  • Úpravy hes10per.tex, aby se to vešlo vždy na jeden řádek; a přitom zjišťuji, že je ještě nutné:
  • Dořešit problémy svátku+neděle v jednom dni:
    • Den reformace
    • Prosby za mír a ochr. života
    • Sv. Štěpána
  • To jsem řešil na souboru hes10per.tex, což bylo blbě, měl jsem na souboru peri, ale přišel jsem an to až pozdě, až když už jsem měl většinu zeditovanou.

w15-pisne[editovat]

2009-10-17 středa[editovat]

Sláva zjistil na poslední chvíli průšvih, kterého jsme si nikdo před tím nevšimnul, že nám někde vypadly všechny písně.

  • adresář /hesla/2010/w12-aut_korekt/
    • 2009-08-04 14:19 hes10-09-blb.pre - tady písně ještě jsou
    • 2009-08-04 15:05 hes10-10blb.pre - tady písně už chybí
    • 2009-08-04 17:10 hes10-09.pre - tady písně ještě jsou
    • 2009-08-04 17:45 hes10-10.pre - tady písně už chybí
    • 2009-08-04 17:46 hes10-09-10.pre.diff - tady se ukazuje, že písně chybí
      • toho jsem si tenkrát všimnul, jenže jsem to pak zapomněl dodělat :-(

w16-sazba+pisne[editovat]

2009-10-09[editovat]

  • Dodělány písně do /pre
  • Znova sazba do TeXu

w17-slava[editovat]

2009-10-10[editovat]

  • Sjel znova sazbu na čisto

w18-html[editovat]

2010-01-20[editovat]

w19-xml[editovat]

2010-01-21[editovat]

  • Teprve dodělávána XML verse:
  • /pre ← /w16-sazba+pisne/pre
  • /prf * ruční dolámání řádků

2010-01-31[editovat]

  • xml-go skriptíček:
cd ../prg; ./hes10prfprg.pl ../prf/hes10??.prf; cd ../xml

./hes10xml.pl ../prg/hes10??.prg

#nsgmls -E2048 -wxml -fhes10-01.err xml.dcl hes10-01.xml
#less hes10-01.err

cstocs utf8 il2 < hes10-01.xml > hes10-01il.xml
sed -i '1 s/UTF-8/ISO-8859-2/' hes10-01il.xml
nsgmls -E2048 -wxml -fhes10-01il.err xml.dcl hes10-01il.xml

#less hes10-01il.err