Állandó rovatok

A RADAR az e-könyv olvasó blog "kis-színes" híreinek társasági gyűjtőposztja. Ha találtál valami témánkba vágót, firkáld ide. Ha izgalmas új könyvmegjelenésbe futottál, oszd meg velünk a KÖNYVRADARon. Köszönjük, a műfaj nevében.

Ha eladó készüléked van, vagy használt kütyüt keresel, a KERES-KÍNÁL rovatunkat ajánljuk figyelmedbe.

Ha valami nyomja a lelked, ha összemérnéd az érveidet másokéval, gyere a DÜHÖNGŐbe. Belépés csak gumicsontokkal.

A fölösleges konfliktusokat elkerülendő megköszönjük, hogy tiszteleben tartod az E-tikettünket.

Ha adakozni akarsz, itt megteheted:

Jelenleg 45.700 HUF-nál járunk. Amire használni fogjuk: blogtalálkozó, wiki, saját domain. Nagyjából ebben a sorrendben :-) Jelképes díjazások: a legjobban pörgő e-könyveknek (Nobel Pizza, 2012-ben három darab), a legszebb ekönyveket készítő műhelyeknek (Szépség Pizza,  2013-ban, három darab).

GYIK - Szerszámosláda

Aki még csak most kezd barátkozni a villanykönyvekkel, kezdje a tájékozódást a GYIK rovatban.

Vannak még:

Válassz és rendelj Kindle-t innen

Mobipocket (prc) gyártási okosságok (Kindle, Kindle for appok)

Epub (Koobe, Nook, iOS, Android) gyártási okosságok kezdőknek és haladóknak 

Kiváló szótárak mindenre, ami bírja.

Sok Kindle trükk.

Kiváló magyar metadata-kollektorok a Calibréhez

Eszközismertetők

Boltismertetők

 

Utolsó kommentek

Címkék

1150 (1) 214 (1) 3g (4) 4700 (1) 600 (1) a9 (1) adamobooks (2) adásvétel (1) ADE (1) adobe (8) ad astra (18) áfa (12) agave (30) ajándék (5) akció (12) aldiko (1) alex (1) alexandra (4) állás (1) amazon (67) android (11) angol-magyar (1) animus (1) antikvárium.hu (1) antireklám (1) apad (1) app (5) apple (17) archiválás (1) asus (1) athena (1) athenaeum (1) atlantis (2) aura (7) avana (1) azw (1) banks (1) Baráth Kati (2) barnes&noble (14) beagle (2) bebook (2) bebook2 (1) bejelentés (3) bemutató (8) biblieteka (2) bigyó (1) blog (1) blogbuli (2) blogtalálkozó (2) bme (1) bookandwalk (4) bookdesigner (2) bookeen (3) bookgem (4) bookline (9) bookmarklet (1) boox (4) budapest noir (1) büntetés (7) calibre (4) Canvas (1) céghírek (1) ces (1) cikkajánló (4) clara (3) cloud (3) co2co (1) coelho (1) cool er (2) crowdfunding (1) crunchpad (1) csőd (1) cybook (8) dedikálás (2) deltavision (1) dibook (16) digitalbooks (12) diploma (1) disney (1) diszlexia (1) doctorow (1) dr1000 (1) dr800 (2) dragomán (1) drm (36) e-könyv (1) e-könyvészet (8) e800 (1) ebooks in Hungary (1) eclassic (5) eclicto (2) édesvíz (3) edge (1) edition 2 (1) eebook platform (1) egyesülés (2) ekm (43) ekönyv-terjesztés (3) ekulturaTV (2) elméleti kérdések (89) ELTE (1) enciklopédia kiadó (1) entourage (1) epub (68) epubcheck (2) események (9) eslick (1) etikett (1) EU (4) e gyetem (4) e könyv (19) e könyvesbolt (40) e könyvtár (3) e könyv formázás (8) e papír (12) fapados (1) fapadoskönyv (9) felmérések (21) firmware (4) fizetés (1) flepia (1) flightcrew (1) fontok (8) forgatókönyv (1) forma (3) formátum (5) fórum (3) frankfurt (2) frissítés (3) fujitsu (1) fumax (2) GABO (3) galaktika (7) galaxytab (1) garancia (1) Gitden (1) gloHD (1) goldenblog (1) goodreader (2) google (5) Grecsó (1) gyakorlati kérdések (68) gyártástechnológia (32) H2O (4) hachette (1) hack (2) hanlin (3) hanvon (4) harlequin (3) hármas könyvelés (4) harry potter (2) hvg (1) ibooks (3) icarus (1) idaságok (1) idpf (2) indesign (1) infografika (2) ingyen (1) introverziók (24) ipad (18) ipad mini (1) ipaq (1) iphone (3) ipubs (7) irex (5) iriver (4) irodalom (2) ismeretterjesztés (4) ismertetők (1) itunes (1) japán (1) játék (2) java (1) javascript (1) javítás (2) jegyzetelés (3) jelenkor (1) jókívánság (2) jótékonyság (3) jumbo (1) karácsony (7) képek (1) képregény (2) keres (1) kickstarter (1) kiegészítő (9) kínál (1) kindle (67) kindlegen (2) kindle dx (6) kindle fire (3) kindle wifi (5) kisepika (2) kleinheincz (5) kloos (1) kobo (21) kölcsönzés (1) kondor (3) konteo (1) könyvajánló (6) könyvesbolt (1) könyvhét (19) könyvkiadás (119) könyvmolyképző (9) könyvtár (6) könyvterjesztés (3) koobe (36) kötelező olvasmányok (1) közlemény (2) közösség (27) kritika (1) lámpa (3) laputa (1) lendink (1) libri (8) líra (2) Lithium (1) lrf (1) lrx (1) ludas matyi (1) magvető (3) makró (2) marketing (2) marvin (2) média (4) mediamarkt (1) megvilágítás (1) mek (4) mese (3) mesemasina (2) metaadat (1) micropayment (1) microsoft (2) middleware (1) mintakönyv (1) mkke (3) mobi (3) mobipocket (20) moly.hu (2) móra (1) msi (1) mu (1) műfaj (1) multimédia (1) multimediaplaza (31) n516 (1) ncore (1) nds (1) neal stephenson (1) nekrológ (1) német-magyar (1) networkshop (3) nook (7) nook2 (3) novella (2) oasis (2) oaxis (1) office (2) oktatás (2) olvasási nehézségek (2) omikk (1) one (1) onyx (9) openinkpot (1) Oravecz Nóra (1) orosz-magyar (1) összeesküvés (1) oszk (3) palm (1) pályázat (10) paperwhite (12) paradigmaváltás (1) paypal (2) pda (3) pdf (11) PearlHD (1) pendrive (1) pizza (2) plastic logic (4) plugin (1) pocketbook (16) podcast (2) popper (1) portal press (2) pottermore (1) prc (15) pre (1) premier (2) publio (5) rádió (4) Rajaniemi (1) rakuten (1) reb (1) rejtő (1) reklám (58) reMarkable (3) reMarkable2 (3) rendelés (2) re poszt (12) riport (1) rss (2) rtf (1) samsung (2) scalzi (7) scida (1) scribd (1) scribe (1) Semmelweis (1) SendToKindle (2) sf (12) sfmag (4) sfportal (18) sigil (2) sipix (1) slideware (1) sony (22) spanyol-magyar (1) specifikáció (2) spiritualitás (1) spotify (1) stanza (8) stardict (2) story (1) streaming (1) syllabux (1) szakdolgozat (1) szellemhadtest (1) szerkesztés (2) szerviz (1) szerzői ellentételezés (3) szerzői jogok (1) szerzői kiadás (6) színes (4) szótár (3) tab (1) táblázatok (1) tablet (10) tankönyv (1) tarandus (4) tarda (1) teaser (1) telefon (1) telekom (1) teszt (66) textr (17) tft (7) tilos (5) tok (2) tor (2) történelem (2) touch (2) txtr (6) typotex (4) t com (14) ulpius (10) üzleti modell (1) vásárlás (11) vegyesfelvágott (14) vendégposzt (4) verseny (5) vízpart (2) vizplex (3) vodafone (3) voyage (4) w3c (1) warez (14) wayteq (1) webáruház (1) web tablet (3) wifi (3) wiki (1) wisereader (1) word (2) xhtml (2) xml (2) yotaphone (1) zinio (1) zsoldos-díj (1) Címkefelhő

Linkek - források

A barátaim, innen onnan

Introverziók: Honnan jön Max?

2012.10.31. 23:21 Dworkyll

Bocs, az előző poszt akkorára sikerült, hogy kiverte a blog.hu biztosítékát. Itt a folytatás.

Dworkyll

Miért is lesz egy tisztességes polgár könyvkalóz?

Már 5 éves koromban tudtam olvasni (írni azóta sem igazán). Kezdetben csak a boltok feliratait, cégéreit böngésztem, ezek többnyire csupa nagybetűkből álltak, így egyszerű volt. Aztán jöttek az újságcikkek címei, majd maguk a cikkek, amelyekből persze majdnem semmit sem értettem, de a betűk a belőlük összeálló, értelmes szavak megbűvöltek. Jöttek a könyvek. Mesekönyveim igazából sosem voltak, az elérhető polcokon az un „ifjúsági irodalom” sem volt túlreprezentálva, ellenben volt Arany Könyvtár, Jókai összes művei és az Olcsó Könyvtár (még a nagyon kis alakú, papírborítós, az ’50-es években kiadott darabok) kötetei, Rejtő művei, az Albatrosz könyvek, így 6-7 évesen már ezeket olvasgattam. Szerencsémre senki sem szólt bele, hogy mit olvashatok, így korán megismerkedtem a felnőtteknek szóló könyvekkel (itt most ne a „felnőttfilmek” kategóriájára gondoljunk) és rájöttem, hogy vannak jó, érdekes írások és olyanok, amelyek nekem nem tetszenek, nem értem őket, nem tudom magam beleélni a szereplők helyébe (némelyiket tíz-húsz évvel később elolvasva rájöttem, hogy csak nem fogtam fel a rejtett értelmét, azt, amiről ténylegesen, a szavak elsődleges értelme mögött szól, másokról meg nem tudom, mi is tetszett rajta 7-8 évesen). Az indiános történetek csak később kerültek a kezembe, mikor beiratkoztam a könyvtárba, ahol rájöttem, hogy van külön „gyermekirodalom”, a gyermekkönyvtárban és ha valami olyat keresek, ami ott nincs meg, megkérhetem a könyvtáros Olga nénit, hogy kérdezze meg a felnőtt könyvtárat, hogy náluk megvan-e. Szerencsémre nem zavart el, mint a legtöbb felnőtt az ilyen kéréssel jelentkező gyereket, hanem segített.

Nagyon szerettem olvasni, ez gyakorta a zongora gyakorlási idő rovására ment, így a zongoraművészi ambícióimat (pontosabban a családom néhány tagjának ilyen ambícióját, mert én tudtam magamról, hogy legföljebb jó iparosa lehetnék a szakmának, művésze sosem) fel kellett adni. Meg még sok mást is, ahogy az mindenki életében előfordul, de a könyvekről sosem mondtam le.

Az első munkakönyves fizetésemmel a zsebemben az első utam az antikváriumba vezetett, ahol majd felét el is költöttem szépen…

Az élet úgy hozta, hogy pár évre fel kellett hagynom a könyvvásárlással, de könyvtárat mindig találtam. Aztán egyenesbe jöttünk, rátaláltam a munkahelyi könyvárusokra, akiknél részletre is lehetett könyveket venni, így kis házi-könyvtárunk folyamatosan bővült, időnként azzal fenyegetve, hogy ránk dől az egész…

Húsz-egynéhány évvel ezelőtt számítógépekkel kezdtem foglalkozni, így rászoktam a képernyőn olvasásra. A szakirodalom jórésze, és a kézikönyvek, használati utasítások viszonylag hamar átköltöztek a nyomtatott médiáról a képernyőre, így természetessé vált, hogy ott olvassuk. Az internet előtt a BBS-eken terjedt az ilyen olvasnivaló.

Hosszú ideig az ilyen olvasás helyhez kötött volt, hisz a számítógépeink nem tudtak elszakadni a konnektortól, vagy ha igen, azt is igen rövid ideig. Aztán megszületett a PDA. Kicsi, kézben tartható, lehet rajta olvasni utazás közben is. Igaz, egy eléggé elfuserált formátumot kezel, így keresni kellett egy olyan programot, amivel a megszokott doc, txt és hasonló állományokat a neki megfelelő pdb, prc formátumra lehet konvertálni. Itt gyorsan szembesül az ember azzal, hogy kedves anyanyelvünk néhány hangjának képi megfelelőjét nem igazán ismeri a nagyvilág. Ékezetes betűinket vagy egyáltalán nem, vagy csak hosszas macerával lehet beleszuszakolni az olvasnivalóba, így megtanultuk ékezetek nélkül is élvezni a szöveget (nem szórakoztató, de van amikor kell). Öreg számítógépesek még emlékezhetnek az utf-előtti idők szabványharcaira. ASCII, kiterjesztet ASCII, CWI, CP-852, ISO-8859-2, stb…

Nos kaptam egy (főnököm által levetett) PDA-t és beleástam magam a konverzió szépségeibe. El voltunk így pár évig. A szöveg olvasható volt, túl sok formázást nem tudott megjeleníteni, de regények, képeket nem tartalmazó szakkönyvek számára épp elfogadható.

Később a PDA helyébe egy HP iPAQ lépett. Ebben már színes kijelző, mobil Windows és kicsit több memória lakott. Azonnal keresni kezdtem azt a programot, amivel a konvertált könyveimet tovább olvashatom. A prc miatt hamar ráleltem a Mobipocket Readerre, nagy örömmel feltelepítettem, majd nagyot koppantam. Ez a prc nem az a prc. Sajnos a kiterjesztés félrevezető, a Mobipocket Reader által használt prc nem a pdb leszármazottja, hanem a mobi formátumot takarja. Ezzel manapság is össze lehet futni, mert a pdb/prc fájlok még közkézen forognak, bár eszköz ami kezeli őket jóideje nem kapható már.

Mindenki, akinek ilyen kis olvasó eszköze van, hamar szembesül azzal is, hogy az olvasnivalót (magyar nyelven) megvásárolni nem nagyon tudja, vagy összeszedi a neten, vagy előállítja maga. A netről leszedhetőek túlnyomórészt „nyers” állapotúak, azaz valaki bescannelte a nyomtatott könyvet, ráküldött egy karakterfelismerő (OCR) programot (ebben nagyon jó pl. a magyar fejlesztésű Recognita, csak kissé drága, így a legtöbben a scannerhez kapott, olyan amilyen programocskát használják, ami meg is látszik az eredményen. Pl. az, hogy nem, vagy nem jól kezeli az ékezetes betűket.), az eredményt úgy ahogy van feltöltötte a netre és nagyon büszke volt magára. Nos az ilyen szövegek inkább idegesítők, mint olvashatók. A formázást hírből sem ismerik, a nyomdahibák helyett többszörös mennyiségű OCR hibát tartalmaznak. Ezekről később még lesz szó.

Marad a saját előállítás. Itt két út van, mindkettő törvénybe ütköző, így aki ezt teszi, megkapja a könyvkalóz rangot a törvény előtt. Az én értelmezésemben kevésbé bűnös út, amikor a papíron, nyomtatott formában a polcon lévő, saját tulajdonú könyvet alakítja valaki magának elektronikus formára. A könyv jogos tulajdonosaként – szerintem – semmiféle kárt nem okozok azzal, ha más formában is olvashatóvá teszem magamnak és családomnak a kötetet. Ennek rengeteg oka lehet, a helytakarékosságtól a cipelhetőségen (egy kis iPAQ-ban többtíz kötet kényelmesen elfér a zsebemben) át mindenkinek más. A lényeg: elő kell venni a scannert, szépen sorban oldalanként beolvasni, majd ráküldeni az OCR programot. Az eredményt fentebb már leírtam. Félkész, hibákkal teli szöveg, amivel még dolgozni kell, hogy élvezhető legyen. Szerintem ugyanez a „bűnügyi kategória”, ha a tulajdonomban lévő könyv scannelt másolatát a netről szerzem be. Ezzel magamnak megspóroltam a scannelés és ocr-ezés munkáját, a javítás azonban igencsak ritkán úszható meg. Kivéve, ha igénytelenek vagyunk.

A neten turkálva találtam néhány prc-t, amelyeken látszott, hogy valaki sokat foglalkozott vele. Nem voltak bennük a megszokott ocr hibák, a formátumban megjeleníthető szövegformázások (címsorok, kiemelt szövegek, versszakok, néha még képek is) is fellehetők, tartalomjegyzék, és más nyalánkságok, amitől a könyv könyv és nem ömlesztett szöveg. Persze a prc puritánságán nem tudtak túl lépni, de amit ebből ki lehet hozni, azt beletették. Láthatóan egy „szabvány ajánlás” szerint készültek. Megtetszett és magam is kezdtem ehhez igazodni az általam előállított prc-knél.

Teltek az évek, megjelentek az okostelefonok. Az iPAQ meg kezdett egyre jobban idegesíteni azzal, hogy napi 40-50 perc használattal (szigorúan csak olvasás, munkába menet, onnan jövet) kétnaponta tölteni kellett. Motoszkálni kezdett bennem a gondolat: telefont mindenképp cipelnem kell, hozzá tartozik a munkámhoz, ki sem kapcsolhatom. Ha már van akkora kijelzős, mint az iPAQ-é, miért ne vonnám össze a két funkciót? Egy kütyü, egy töltő (sőt egy sem, mert szabad USB mindig van valahol). A szép új telefonomra egyből beszereztem a MobiPocket Reader megfelelő verzióját, nagy örömmel elindítottam és nagyot koppantam. Használható, de épp csak. Külön virtuális billentyűzet program kell mellé, mert az érintőképernyőt nem kezeli (fura, mert a winmo verzió igen), könyvjelzőzni nem lehet, stb… Keressünk mást. Prc képes olvasó gyakorlatilag nem létezik Symbian-ra. Mi van még? FictionBook (FB2) olvasóból számtalan. Ez a formátum, ha lehet még puritánabb, mint a prc. Gyakorlatilag ismeri a cím, alcím, versszak, idézet, alapértelmezett bekezdés fogalmát, oszt slussz. Beágyazott képek, sortávolságok hangolása és hasonlók? Ismeretlen. Ellenben a prc forrásául szolgáló html-t másodpercek alatt lehet egy kis linux (vagy windows alatt cygwin) shellscripttel fb2-vé konvertálni. A script összeállítása eltartott egy darabig.

A keresés persze nem állt le, így rábukkantam az e-pub formátumra. Amikor a próbálgatás közben rátaláltam a neten az Alice csodaországban angol, rajzokkal illusztrált e-pub verziójára, tudtam, hogy ezt kerestem. Mindent tud amitől a könyv könyv és nem csak szöveg. Amit egy nyomda egy könyvbe bele tud tenni, azt az e-pub (minimális kompromisszummal), vissza tudja adni. A megfelelő olvasóval.

Itt álljunk meg egy pillanatra. Attól, hogy egy olvasó képes e-pub-ot olvasni, még nem biztos, hogy az olyannak fog látszani a kijelzőn, amilyennek az alkotója megálmodta. Az alapvető probléma az, hogy az e-pub szabvány ajánlásait nem minden olvasó program fejlesztő képes beépíteni a programjába. A szöveg megjelenik mindegyikben, abban nincs hiba (illetve van, de erről később), de a szépségeket, amivel az e-pub több mint pl. az fb2, nem mindegyik. Mivel az e-pub is egy (több) xml, az fb2 is egy xml, a parserek (olvasó/értelmező program) képesek a szöveget kibogozni és megmutatni, de a formázási utasításokat csak nagyon kevés képes helyesen értelmezni és megjeleníteni, mivel az e-pub képes olvasó programok túlnyomó része eredetileg fb2 olvasóként született. Ha egy olvasó kütyü képességeinél az fb2 és az e-pub egyaránt benne van a listában, kezdhetünk gyanakodni, hogy a gyönyörű e-pubjaink nem egészen olyanok lesznek, ahogy ezt megálmodtuk. Ha Adobe DRM-es e-pub-ot is tud kezelni, akkor van remény, mert ezek többnyire a ADE (Adobe Digital Edition) alapján fejlesztett programok. Sajnos manapság az ADE az egyetlen e-pub olvasó, ami képes az e-pubban használható beállításokat úgy-ahogy megjeleníteni. Ennek is vannak korlátai, de ez tudja a legtöbbet kihozni a forrásból.

Közben a prc (mobi) szabványt kitaláló és a MobiPocket Readert istápoló céget az Amazon nevű internetes kereskedő cég felvásárolta (többek között emiatt is maradt úgy a Symbian-os olvasó ahogy) és erre alapozva kitalálta, majd megvalósította a Kindle családot. Ez egy e-papírt használó olvasó eszköz. Kezdetben meglehetősen drágán, majd az üzleti modellt újragondolva, szemtelenül olcsón kezdték árusítani a készüléket. Rájöttek, hogy a kütyü eladásakor akár veszíthetnek is, ha ezzel megalapoznak egy később több e-book eladását lehetővé tevő kapcsolatot a vásárlóval. A sok pénz a folyamatos eladásokban és nem az egyszeri nagy bevételben van. A prc korlátai adottak, azokon túllépni nem nagyon lehetett. Emiatt az Amazon a tablet piacra kilépésével (Kindle Fire) egyidőben kitalálta azt a formátumot is, ami már felér (sőt bizonyos pontokon el is hagyja) az e-pubbal. Ez a KF8, aka MOBI formátum. Úgy rakták össze, hogy a fájlban benne van az új (KF8) és a régi (prc, vagy KF7) formátumú fájlcsomag egyaránt, így – elvileg – a régebbi (K3-tól) és az új olvasók egyaránt képesek kezelni. Ez a K3-ak esetében nem minden fájlra igazak, némelyiket nem tudják megnyitni, de mostanában kijöttek azok a firmware-k, amelyekkel ez a probléma megszűnik.

Igazából ez az írás azért született, mert lassan a magyar kiadók is rákapnak az e-pub/prc készítésre, de sajnálatos módon néhányan rossz irányba indultak és piacra kerültek az igényesebb „házibarkács” szintjét sem elérő példányok. Otthon, magán célra elmegy, de boltban árusítva, vagy bolt oldaláról egyfajta bemutatónak szánva ingyenesen letölthető darabok esetén inkább visszariaszt, mint ösztönöz a vásárlásra. Az elkövetett hibák egy része már olvasás közben is látszik, más részük csak a forrást böngészve. Erre persze mondhatnánk, hogy minek a forrást nézegetni, ha az olvasó élményét nem zavarja. Nos, ha a forrásban felesleges hulladék maradt, az a fájl méretét növeli. Manapság ezzel nem sokat szoktunk törődni, de többünket zavar. Ezen kívül, mivel az e-pub és az olvasó programok is folyamatosan fejlődnek, nem kizárt, hogy később ezek megjelenítik azt, amit manapság nem, illetve később, újabb formátumkonverziónak alávetve az ilyen forrásokat, sokkal több munkát okozhatunk magunknak, mintha most kigyomlálnánk, ami nem oda illő.

Ettől lesz egy e-könyv igényesen kivitelezett és ehhez kell a könyvkalóz szenvedelmessége, avagy a jó iparos szakmai önérzete.

Szóval: szeretek olvasni, szeretem a jó, szépen kialakított könyveket. A tartalom és a forma együtt adja meg egy kötet értékét és ez igaz az e-könyvekre is. Ha ezt nem kapom meg a pénzért sem, akkor kénytelen vagyok előállítani magamnak és ha ettől könyvkalóz lettem, hát így jártam.

23 komment

Címkék: introverziók

A bejegyzés trackback címe:

https://ekonyvolvaso.blog.hu/api/trackback/id/tr34883004

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

KTamas · http://ktamas.com/ 2012.11.01. 12:38:56

"Úgy rakták össze, hogy a fájlban benne van az új (KF8) és a régi (prc, vagy KF7) formátumú fájlcsomag egyaránt, így – elvileg – a régebbi (K3-tól) és az új olvasók egyaránt képesek kezelni. Ez a K3-ak esetében nem minden fájlra igazak, némelyiket nem tudják megnyitni, de mostanában kijöttek azok a firmware-k, amelyekkel ez a probléma megszűnik."

Tudsz adni peldafajlt? Nekem Kindle 1-em van es az a -- viszonylag egyszeru -- hibrid kf8-as tesztfajlom gond nelkul megnyitotta.

szakértőbb 2012.11.01. 13:27:47

SZia!
Forrast olvasgatni szerintem perverzio:-) (persze maganugy).
De ha a meret a kifogas a gagyi forras ellen, akkor a KF8-nal miert nem zavar a kozel ketszeres meret?

Amugy ezzel nem azt mondnanam, hogy legyen/lehet sz@r a forras, hanem sose jutna eszembe nezegetni, ugyanis a KONYVET olvasom:-) Aki a forrast, annak mas a celja...

kIára 2012.11.02. 12:19:57

@szakértőbb:

Lehet perverziónak is tekinteni, minden ember weirdo egy kicsit, a tisztaforrás-mánia amúgy Bartók óta nemzetkarakterológiánk része :D     Abban mindenesetre egyetértünk, hogy aki ELŐBB nézi meg a forrást, és csak utána olvassa el a szöveget az valóban fura muki.

Mégis könyvekről lévén szó engedj meg egy papíros analógiát.
   Létezik egy pszichés zavar, nevezzük a nagyok nyomán bibliolátriának. Ez a könyvimádat beteges formában pl. abban nyilvánul meg, hogy az illető nem vásárolja meg akár kedvenc írója legújabb könyvét sem, mert amint belelapoz látja, hogy a tördelő a sorkizárás ellenére nem hallott az optikai margóról és ezért minden sor „egérrágta”, az oldalszám más betűvel van szedve mint a kenyérszöveg, vagy nincsenek ugráló számok a folyószövegben, a behúzás aránytalan, az elválasztásokkal baj van, és így tovább és így tovább.
   Én is nagyon tudok fanyalogni amikor könyvesboltban egy találomra fellapozott könyvben első blikkre találok két-három könyvellenes merényletet. Namost ezzel szembesüljek további néhányszáz oldalon? Kösz, inkább nem. Becsszó, nem tudnám végigolvasni, annyira idegesítene.

Van egy nagyon kedves, nálam jóval idősebb ismerősöm, aki több mint harminc évig volt az egyik nagy kiadó szerkesztője. Ha ő egy olyan könyvet talál amelyikben az utolsó sor utolsó szava elválasztásra végződik (szerintem is undorító, különösen páratlan oldalon) vagy ha a sorok végén ott árválkodnak az „a” betűk akkor konkrétan rosszul lesz. Nem viccelek. Mellesleg nagyon költségkímélő dili, hiszen a jelenlegi papírkönyvek 90–95%-a szenved hasonló könyvbetegségektől. Csak van aki tud ezzel élni és van aki nem, és van aki még szóvá is teszi.

kIára 2012.11.02. 12:48:13

Visszatérve a forráskód tisztaságára.
Egy Officeból (mindegy melyikből) exportált html általában a valós tartalom két, két és félszeres szeméttel van terhelve. (Egy 1,3 mb-s export tisztítva 600-770 kb.)
De NEM a méreten van a hangsúly!
Lazán bedobható egy epub-mobiba. A parser kicsit többet izzad, lesz egy-két glitch, max. tovább tart az indexelés de sebaj. Simán lehet élni ezzel is.

   Az első konkrét probléma a továbbkonvertálás. Tegyük fel, hogy valakinek csak FB2-képes kütyüje van. Talál egy számára fontos könyvet a két nagy formátum valamelyikében és kénytelen konvertálni. (Elegánsan kihagyom a DRM-nyűgöt, tegyük fel, hogy könyvünk „puha”). A tag-szemét miatt (mivel az FB2-re „csupaszítani”, egyszerűsíteni kell) a konverzió (1) nagy nehezen létrejön, és jó esetben csupán csúnyácska lesz, (2) elakad. Panasz, sírás-rívás, fórumok turkálása, új, jobb szoftverek konverterek letöltése, kipróbálása, minderre annyi idő fecsérlése ami a könyv elolvasására is bőven elég lenne.

Másik probléma a vakok és gyengénlátók számára készített text-to-speech engine-k. Oké, egy csomó e-readerben van felolvasó, sőt szinte mindegyikba (ha még nincs) magyart is lehet bele hekkelni. De nincs minden látássérültnek e-könyvolvasója, van azonban desktopja, speciális alkalmazása, készüléke stb. Jöhet a törés, kibontás, tisztítás, megfelelő konverzió majd… a szuper élmény amikor az izgalmas jelenet közepén: „Péter span class egyenlő pégékettö »lelökte a szikláról« per span”. )
(Itt lehet gyönyörködni benne: www.youtube.com/watch?v=VulewtWzdaE )

Fenntarthatóság, fejlesztés, update, lépéstartás.
    Belegondolni is rossz, ha mondjuk az Amazon tesz egy logikus de „meggondolatlan” lépést, és mondjuk úgy dönt, hogy ezentúl az input xhtml strict, csak ez mehet a kdp-be, és a K3-tól felfele nyom minden readerre egy frissítést ami egyrészt olvashatatlanná tesz minden, a MobipocketCreator őskövülettel gyártott prc-t és az összes olyan kindlegennel készült mobit ami nem xhtml/epub inputból készült. Sci-fi? Csak elmerengtem.
    Ám mi van akkor, ha egy kiadó ír egy privát üzenetet Max barátunknak, hogy tetszett amit olvastunk, látjuk értesz is hozzá, szeretnénk ha ezentúl nekünk dolgoznál e-könyv darabáron, illetve gondoznád a már kész, kb. 350 db-ból álló kínálatunk. Az utóbbi miatt hidd el Max ezerszer meggondolja az ajánlatot, mert világosan tudja, hogy hamarabb készít el kétszer annyi új e-könyvet, mint amennyi idő alatt rendbe tenné, kipucolná a meglévőket.
    Az IDPF validatora (az epubcheck) már most nagyon finnyás a hibás tagekre és még inkább az lesz (lásd a 3.0 beta verziót). Egy sehol nem látható, a megjelenítésben egyáltalán nem játszó, harmadrangú fájlocska, ötödrangú tag-jének hibája miatt szépen visszadobja a „kész” könyvet.

Folyt. köv.

kIára 2012.11.02. 18:15:35

A kilencvenes évek végén, az ezredforduló tájékán volt a sokunk számára kedves netboom korszak, amit a GeoCities, az IE6, a Win98-ról XP-re való romantikus áttérés határozott meg. Amit a nethistorikusok vagy retrókutatók jogosan neveznek az eretnekségektől dúlt sötét középkornak. Mindenki webmester lett, gyártotta az érdektelentől a hihetetlenül fontosig a maga hálózati tartalmát általában a korabeli Word csúcsszuper „mentés másként” html módszerével. Szinte senki sem gondolt bele (pontosabban alig néhány embernek volt fogalma arról), hogy egy bekezdésnyi tartalom mellé három bekezdésnyi markup-szeméttel „gazdagítja” a világhálót. A világ, a szolgáltatók és tartalomgyártók lassan (de szerencsére) felébredtek; a rossz felhasználói szokások és (alacsony) -igények azonban sajnálatos módon rögzültek, reflexszé váltak. (A rögzült IE6 használat Albionban konkrétan közigazgatási problémát okozott, jelentős költségvetési vonzattal.)
Én például azért is ágálok az Atlantis-szal készített epubok vagy MobipocketCreatorral generált prc-k ellen, mert szintén rossz felhasználói szokásokat rögzítenek és örökítenek át, és amikor végleg leáldozik ezeknek az alkalmazásoknak a kora, akkor a boldog féltudatlanságban hagyott civilek fogják leginkább a kárát látni. A nehezen megszerzett féltudásuk mehet a kukába. A Creator Win 7-es használatához már most hozzá kell adni az IE9 fixes-t ha továbbra is használni akarjuk, azt pedig nem is tudom, hogy Win8-ra egyáltalán lehet-e telepíteni.
Szóval nemcsak az a baj, hogy adott esetben szemetesek a generált tartalmak, hanem az is, hogy rövid életűek és emiatt jövőbeni rekonstruálásuk nehéz lesz. És miért akarjuk megnehezíteni a minket követő generáció életét? – teszem fel a költői kérdést.

(A környezettudatosság és egészséges ökoszisztéma fogalma nemcsak a bio- hanem a netszférában is fontos.)

Gukker 2012.11.02. 22:18:53

@kIára: "Én például azért is ágálok az Atlantis-szal készített epubok vagy MobipocketCreatorral generált prc-k ellen, mert szintén rossz felhasználói szokásokat rögzítenek és örökítenek át"...

Lehet, csak pont az a baj, hogy nincs élhető alternatíva.
Bocs, de Linux bash-sel buherálás és Text editorokkal való forráskód olvasgatás és szerkesztés nem az.
Még a '90-es évek elején, amikor konkrétan Notepaddel írtuk be a html tageket... kösz, de nem sírom vissza.

Dworkyll · http://ekonyvolvaso.blog.hu/ 2012.11.02. 23:19:48

@kIára: Belehalsz a szépségbe ;-) közben meg nem veszed észre, hogy sem az epub, sem a prc nem archiválási formátum. Most jó, holnap meg a fene tudja. majd aggódunk miatta holnap.

Civilek nyugodtan archiválhatnak rtf-ben, a profik meg xml-ben. Olyan nincs, hogy ma kipolírozott fogyasztásra szánt file holnap is jó tökéletes lenne. Szépen vissza kell menni mindig az alapokhoz.

Ezért érzem összeségében véve picit túlzónak a digitális puritanizmusotokat. Szép szép a tökéletesség, de ha töredékráfordítással _majdnem_ olyan szépet tudok, akkor rátok hagyom a végtelenre polírozást ;-)

(Persze előbb jól lenyúlom a "gazdaságosan" használható tippeket :-P )

kIára 2012.11.03. 11:22:23

@Gukker: @Dworkyll:
Bár nem vagyok ennek a blognak a legaktívabb kommentelője, azért remélem, hogy az évek során mindenki számára világos lett, hogy én különválasztom a kereskedelmi, a közhasznú és a civil digitális tartalomgyártást és -fogyasztást. A dolog ott válik bonyolulttá mikor … (de ezt egyszer máskor, talán egy monstre triplaposztban, az első szikára vésett jeltől, a reneszánsz digitális szövegeken át a textuálutópiákig).

Én a közhasznú körből érkezem, még jobban szűkítve a felsőoktatásból, jelenleg a piac egyik aprócska szereplőjének vagyok egyik szekértologatója, és kb. 13 éve követem figyelemmel, veszek részt (MKKE ügynökök figyelem!) a civil – ha úgy tetszik kalóz – könyvmozgalmakban (Tibiné Klára, a triplaügynök, hehe). Az alapjaim miatt legeslegjobban a MEK-re és az összes többi közpénzből finanszírozott szövegdigitalizálási projektre haragszom és órákon át tudnám szidalmazni őket (mint dühöngő próféta, legjobban szeretett népét).
A lényeg, hogy személyesen sem a piac szereplőit, sem a public domain tartalomszolgáltatókat nem féltem. A civileket azonban igen. Több okból is. Az évek során azt tapasztaltam, hogy a rövid távon alkalmazható, zárt rendszerű tudás (pl.: tanuljunk meg egy adott program célszerű kezelését) megosztása nem alkalmas és nem elégséges egy evolutív, plurális, egészséges diverzitást mutató, kontinuitást biztosító civilszféra és -mozgalom fenntartására. Ennyi. Saját szorongásaim verbalizálom.

               Pont ezért örültem Max barátunk utóbbi két posztjának, (persze nemcsak ezeknek, bőven találunk itt további remek posztokat) mert remélhetőleg a három szféra idetévedő képviselői most egy kicsit meghökkentek, elgondolkodtak, hogy hoppá, van ilyen is, lehet így is. (Nyalizás vége).

kIára 2012.11.03. 11:28:47

@Dworkyll:
         (Persze előbb jól lenyúlom a "gazdaságosan" használható tippeket :-P )
Azt hiszem, hogy pontosan ezért írogatunk ide.
————
Kányádi Sándor bácsi szokta mondogatni, mikor könyvheti vagy egyéb dedikálásokon a rajongói jönnek a Kaláka által megzenésített verseinek kalózmásolatait dedikáltatni:

        „Lopjatok, fiaim, lopjatok, csak jó szívvel és tiszta lélekkel”.

Dworkyll · http://ekonyvolvaso.blog.hu/ 2012.11.03. 19:03:23

@kIára: Figyelmeztetlek, még egy ilyen komment, és megvonom a hozzászólási jogaidat ;-) és addig nem is kapod vissza, ameddig nem írsz egy egész posztot az Introverziók/Elméleti kérdések cimkék alá :D

jegyzetelő 2012.11.04. 11:10:48

@kIára: Az eszmefuttatásod irányvonalával egyet tudok érteni, azzal viszont nem, hogy egyetlen Office sem tud szép, feleslegmentes html-t készíteni. A Word pl. elég jó úton halad. Sőt, a lehetőségeihez mérten szinte már majdnem ott is van. Az apróbb hibák kijavítása automatizálás nélkül sem nehéz feladat.

Sarkvideken · http://sarkvideken.blog.hu/ 2012.11.06. 10:45:30

jó cikkek és valóban kIára is összekommentelt egy jó posztra valót.
amennyire kiolvasható és helyenként tapasztalható is, a könyvkiadásban (papír és villany) nincs annyi üzleti potenciál, hogy egy végtelenül igényes kiadványt kaphasson a vásárló. ilyennel akkor találkozunk, ha maga a kiadó igényes a munkájával szemben, függetlenül attól, hogy üzleti szereplő, vagy házibarkács mesterember.
nem hiszem hogy a jövő az, hogy civilek ezrei válnak képzett tipográfussá, ellenben egyre kifinomultabbak lesznek az eszközök, amivel bárki automata módon tud nyomtatott tartalomból elektronikusat fabrikálni. most az ekönyvkészítés geocities-korszakát éljük, de nem kell egy évtized, hogy egy drag and droppal a felhőbe rántsuk a friss szkennelésünket, ami másodpercek múlva már a feedet küldi szét az ismerőseinknek a teljes tartalommal.

Ignis_veneficus 2012.11.09. 13:11:55

@Gukker: kb 3 eve van meg a megoldasom, ami nem kezzel torteno html buheralas, de nem is atlantis fele "docmenteshtmlbe"
De lassuk be kezimunka nelkul nem fog menni.

Gukker 2012.11.09. 13:18:11

@Ignis_veneficus:
"kb 3 eve van meg a megoldasom"

ésmiazmiaz??? :)

Nekem egy olyan tisztességes wysiwig szerkesztő hiányzik, amivel e-könyves paramétereket is lehet beállítani pl. arányok megadása pontos értékek helyett (% vs. pt).
Gyakorlatilag egy e-könyvgyártásra optimalizált html/xml editor kéne.
(Ez itt a reklám helye: Nekem még a Namo WebEditor jött be a legjobban, de persze annak is sok hiányossága van és ráadásul fizetős.)

Ignis_veneficus 2012.11.09. 13:18:56

@Sarkvideken: Felhos OCR es konvertalas akkor fog menni (jol) ha a van rendes MI (mesterseges intelligencia)
Ha csinaltal eddig OCR-t, akkor tudnad, hogy milyen szivas amikor elmosodott a betu. kicsit. pl c es e es ez egy a konyv nyelvehez kepest idegen nyelven szoban/nevben.
vagy amikor az OCR a parbeszedbol felsorolast csinal.
es akkor ott a sorvegi kotojel problemaja is (mikor maradjon, mikor menjen).
Bekezdes vege? a kov sor hozza tartozik vagy nem? a mostani OCR-ek a lapok osszefuzeset sem mindig ugorjak meg. Es akkor meg nem is beszeltunk a lap aljara kerulo "ures sorrol"...
Szal szerintem minosegi automatikus OCR egy darabig nem lesz

Ignis_veneficus 2012.11.09. 13:37:24

Adok egy tippet az XML (nem HTML) piszkaloknak:
OpenOffice vagy LibreOffice. Ennek a sajat formatuma XML (ODT)
Benne van minden (osszes stilus, es nem csak a neve)
a konyv osszeallitoknak (kindlegen es tarsai, nem a csili vili WYSIWYG editorok) bemenete html es XHTML
Innentol csak egy lepes felismerni, hogy egy, vagy tobb XSLT alkalmazasaval el lehet allitani a kivant XHTML es egyeb fileokat.

Ignis_veneficus 2012.11.09. 14:28:48

@Gukker: "Még a '90-es évek elején, amikor konkrétan Notepaddel írtuk be a html tageket... kösz, de nem sírom vissza."
most csak azert nem notepaddal irjuk a html-t, mert
1, a dinamikus weboldalaknal server oldalon olyan eszkozkeszletek jelentek meg amik mar kicsit magasabbszintu alkalmazaskeszitest tesznek lehetove.
De ha az adott eszkoz nem jol mukodik, vagy neked nem jo, akkor vagy keresel masikat, vagy varsz a javitasra, vagy megnyitod a notepadot es fixeled, ujrairod.
2, mert a CSS-t heggeszti az ember notepaddal :D
(nem, nem lattam fejlett weboldal szerkesztot, de a tapasztalat, az, hogy a generalt cuccok mindig gazosabbak, mint amit az ember az alapokbol epit fel)

Gukker 2012.11.09. 14:34:43

@Ignis_veneficus:
"most csak azert nem notepaddal irjuk a html-t, mert"
Ok, de még a két pontodban vázoltaktól is olyan messze vagyunk, mint Makó Jeruzsálemtől. :(

Gukker 2012.11.09. 14:36:02

@Ignis_veneficus:
"OpenOffice vagy LibreOffice. Ennek a sajat formatuma XML (ODT)"
Ugyanez dettó igaz a MS Wordös docx-re is. Az is egy zippelt xml.

Dworkyll · http://ekonyvolvaso.blog.hu/ 2012.11.09. 14:56:48

@Gukker: És ott van az a remek wbs script, ami pöpecre takarítja a word féle szűrt html-t. Na az a tuti ;-)

Ignis_veneficus 2012.11.09. 15:29:17

@Gukker: igen, de a ket formatum leirasa kicsit elter terjedelmben. ha jol emlexem a docx-e valahol 900 oldal korul volt.
+2 erv a openoffice mellett:
1, ingyenes (es fut linuxon is)
2, lehet parancssorbol scriptteket futtatni vele, vagyis egy rtf-odt konverzio mehet parancssorbol batch-bol...
süti beállítások módosítása