Ακίνδυνη Λογική

Τα πόθεν έσχες σε μορφή απλού κειμένου

Posted in Uncategorized by akindynos on 20 Δεκέμβριος, 2011

Τα πολλά λόγια είναι φτώχεια

Η διεύθυνση για το flash viewer είναι της μορφης:

http://www.hellenicparliament.gr/userfiles/pothen/avramopoylos_dimitrios_lamproy/index.html

Η διεύθυνση για το απλό κείμενο είναι της μορφής

http://www.hellenicparliament.gr/userfiles/pothen/avramopoylos_dimitrios_lamproy/files/assets/search/searchtext.swf

Αυτό το searchtext.swf δεν είναι flash αλλά ένα συνηθισμένο αρχείο ζιπ που περιέχει ένα searchtext.xml

Δυστυχώς η χρήση xml περιορίζεται σε page nodes με το κείμενο κάθε σελίδας σε απλή μορφή.

Και πολύ μας πέφτει λέω εγώ!

Επειδή το searchtext.xml στέλνεται με Content-Type: application/x-shockwave-flash δεν ωφελεί να δοκιμάσεις να το κατεβάσεις από τη γραμμή διεύθυνσης.

Μπορείς όμως στην κονσόλα του μπράουζερ (control shift K στον firefox) να δώσεις var arr = document.querySelectorAll("a[target='_blank']"); for(var i=0; i < arr.length; i++) arr[i].href = arr[i].href.replace("index.html", "files/assets/search/searchtext.swf"); και μετά δεξί κλικ και αποθήκευση με κατάληξη zip

Advertisements
Tagged with:

8 Σχόλια

Subscribe to comments with RSS.

  1. Γιώργος Μαργαρίτης said, on 21 Δεκέμβριος, 2011 at 1:58 μμ

    Το πιο εύκολο που μπόρεσα να κάνω για μετατροπή xml σε plain text (debian/bash):
    http://pastebin.com/raw.php?i=y6ct8QT2

  2. Γιώργος Μαργαρίτης said, on 21 Δεκέμβριος, 2011 at 2:14 μμ

    ΥΓ: όποιος έχει χρόνο (μακάρι να είχα), με το txt2tags (apt-get installable) μπορεί να κάνει εύκολα παπάδες, ακόμα και μία μίνι wiki :)

  3. akindynos said, on 21 Δεκέμβριος, 2011 at 3:01 μμ

    Το βράδυ θα έχω έτοιμη μια επέκταση για firefox που θα επιτρέπει να δεις το απλό κείμενο με ένα κλικ

  4. […] UPDATE: Να άλλα τρία πράγματα που γράφτηκαν για το θέμα: Από τον vrypan Από το e-cannibals.gr Και μια αναζήτηση πρακτικής λύσης […]

  5. navagos said, on 21 Δεκέμβριος, 2011 at 8:12 μμ

    Τα XML δεν έχουν μέσα μορφοποιημένο κείμενο. Χρήσιμα μεν, αλλά plain text. Από την άλλη βλέπω με sniffer σε κάθε κλικ να έρχονται αρχεία του στυλ http://www.hellenicparliament.gr/userfiles/pothen/aleyras_athanasios_georgioy/files/assets/pages/page0004.swf?rnd=62a0a410a3637c35ca29106427e18b74 τα οποία δεν έχω καταλήξει τι ακριβώς περιέχουν. Ίσως το περιεχόμενο μορφοποιημένο ή κάτι άλλο χρήσιμο;

  6. navagos said, on 21 Δεκέμβριος, 2011 at 9:00 μμ

    Νομίζω ότι αυτό το text (από αυτά τα XML αρχεία) έχει ως σκοπό μόνο να διευκολύνει την αναζήτηση (με λέξεις κλειδιά) μέσα στα κείμενα. Και άρα δε μπορούμε να ανακατασκευάσουμε τα περιεχόμενα μέσα από αυτά τα XML αρχεία και μόνο.

    Θα μου πεις, γιατί; Γιατί όχι;

  7. […] C) Downloading and analysing the data is illegitimate according to the terms of use. However if you seek a practical resolution to the problem imposed by the Flash format you may read here. […]


Σχολιάστε

Εισάγετε τα παρακάτω στοιχεία ή επιλέξτε ένα εικονίδιο για να συνδεθείτε:

Λογότυπο WordPress.com

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό WordPress.com. Αποσύνδεση / Αλλαγή )

Φωτογραφία Twitter

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Twitter. Αποσύνδεση / Αλλαγή )

Φωτογραφία Facebook

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Facebook. Αποσύνδεση / Αλλαγή )

Φωτογραφία Google+

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Google+. Αποσύνδεση / Αλλαγή )

Σύνδεση με %s

Αρέσει σε %d bloggers: