Autore Topic: Parse pagina web  (Letto 478 volte)

Offline Luigi.Arena

  • Utente senior
  • ****
  • Post: 616
  • DACIA DUSTER 4X4 SUPER
  • Respect: +56
    • Mostra profilo
    • ArenaWebTest
  • Dispositivo Android:
    epad m009
  • Play Store ID:
    Luigi Arena
  • Sistema operativo:
    Windows 7
Parse pagina web
« il: 28 Febbraio 2012, 15:38:10 CET »
0
Mi serve un aiuto , credo di aver provato di tutto  :-P
Ecco il problema:
Ho una pagina xml che prelevo da un server, così composta:
Codice (XML): [Seleziona]
 <?xml version="1.0" encoding="iso-8859-1"?>
<p>&#38;#79;g&#38;#103;e&#38;#116;&#38;#116;&#38;#111;:</p>
non mostro altro perchè il problema è proprio qui

Come potete notare il dato è in formato asci e se proviamo a convertirlo si leggerà "Oggetto:"

Bene anzi male.

Questo è il codice per prelevare la pagina e poi facendo un parse visualizzare i dati:
Codice: [Seleziona]
URL url = new URL(_linkCompleto);
                                                BufferedReader reader = null;
                                                StringBuilder builder = new StringBuilder();
                                                try
                                                        {
                                                                reader = new BufferedReader(
                                                                        new InputStreamReader(url.openStream(),
                                                                                "UTF-8"));
                                                                for (String line; (line = reader.readLine()) != null;)
                                                                        {
                                                                               
                                                                                builder.append(line);
                                                                               
                                                                        }
                                                        }
Semplicemente prelevo la pagina e poi memorizzo ogni singola riga.
Peccato che poi quando vado a vedere quello che leggo usando trovo dentro semplicemente.
Codice (XML): [Seleziona]
<p> g:</p>
Sembra che tranci via tutte quelle codifiche.
A me basterebbe prendere la pagina pura con i caratteri asci, ci penso io a convertirla.
Grazie
È stata trovata una soluzione al tuo problema?Evidenzia il post più utile premendo . È un ottimo modo per ringraziare chi ti ha aiutato .