Autore Topic: Problemi libreria Jsoup, parsing HTML  (Letto 741 volte)

Offline lz91

  • Nuovo arrivato
  • *
  • Post: 37
  • Respect: +1
    • Mostra profilo
  • Dispositivo Android:
    Samsung Galaxy S I-9000
  • Sistema operativo:
    Ubuntu, Windows 7
Problemi libreria Jsoup, parsing HTML
« il: 16 Settembre 2012, 10:42:38 CEST »
0
Ciao ragazzi
sto provando a fare un parsing di una Pagina Html con la libreria Jsoup.

Son gia' riuscito a fare qualcosina ... ma non riesco a capire una cosa.
Purtroppo il sito non e' mio, percio' non possso modificare nulla.

La mia pagina tipo e' questa:

Codice (XML): [Seleziona]
....
<td>
                  <b>Titolo: <font color="#FF6600">NOME TITOLO</font></b>
                  <br><br>
                  <b><font color="#FF6600">Genere: </font></b>TIPO GENERE
                   <font color="#CCCCCC"> | </font>
                  <b><font color="#FF6600">Tempo: </font></b>DURATA
                  <hr width="100%" size="1" color="#CCCCCC">
                  <br>
                  <b><font color="#FF6600">Regia: </font></b><br><br>
                  <b><font color="#FF6600">Cast: </font></b>
                    TESTO TESTO TESTO TESTO
                  <hr width="100%" size="1" color="#CCCCCC">
               </td>

...


Con Jsoup sono già riuscito a estrarmi per esempio il NOME TITOLO cosi' :

Codice: [Seleziona]
...

              Document doc = null;                                     
                try {                                             
                    doc = Jsoup.connect("www.indirizzoWeb.it").get();
                   
                } catch (IOException e) {                         
                    e.printStackTrace();                     
                }     

                Elements resultLinks = doc.select(" table > tbody > tr > td > b > font ");
               
                /* prendo titolo*/
                linkStr.add( resultLinks.get(0).text() );

...



linkStr è un ArrayList a chi interessa.

Ora, come faccio a prendere per esempio TIPO GENERE o DURATA o TESTO TESTO TESTO TESTO ?
Cioe' se volessi prendere l'informazione TIPO GENERE, non essendo dentro a < ... > TIPO GENERE  </ ... > con riesco.
Voi avete qualche idea ? :)