Case history

Crawler Aste Giudiziarie

Per importante Cliente del Nord Italia operante nel settore delle aste immobiliari, abbiamo realizzato una soluzione software detta crawler o bot, per il recupero automatico delle informazioni relative agli immobili dei tribunali di interesse, presenti su alcuni portali web di aste giudiziarie.

Il crawler in oggetto è infatti in grado di lanciare una ricerca su tali siti e di analizzare tutte le schede trovate per il recupero dei dati di interesse, es.: tipo di procedura (esecuzione, fallimento, causa, concordato preventivo), codice rge, data e prezzo vendita con incanto, data e prezzo vendita senza incanto, indirizzo dell'immobile, lotto, dati catastali, valore della perizia, ecc.


Questi dati vengono normalizzati in un formato comune e salvati in un database da cui possono essere poi estratti e inviati al Cliente in un formato XML di suo interesse.

Il crawler è stato sviluppato con una programmazione cosi detta difensiva ovvero è in grado di procedere nonostante alcune pagine non siano fatte come atteso oppure non contengano tutte le informazioni necessarie o ancora il sito da visitare non sia raggiungibile o riporti degli errori.

In altri termini il crawler si comporta esattamente come un utente che davanti al browser apre il sito di interesse, effettua una ricerca per tribunale e apre ogni singola scheda e si segna i dati di interesse che trova nella scheda.

Il tipo di tecnologia applicata in questo caso (web scraping) si può applicare su qualsiasi sito dal quale si vogliano collezionare delle informazioni in modo automatico.

Tale tecnologia è in grado di effettuare login, completare campi, cliccare su bottoni, inviare dati, ecc. Esattamente come farebbe un umano. Il sito oggetto dell'attività del crawler non percepirà infatti la differenza rispetto alla normale attività di un qualsiasi altro utente.

Hai bisogno di una soluzione per il recupero automatico di dati da uno o più siti web? Chiedici un preventivo!

Autore: Giovanni Chiodi
Senior software developer con più di 10 anni di esperienza nello sviluppo di soluzioni web based, enterprise, su misura. Dal 2011 socio fondatore di Garda Informatica Snc condivide questa avventura col fratello Lorenzo.

Promemoria sui Cookie e sulla Privacy

Leggi l'informativa
closeIcona closesearchIcona searchmore vertIcona more vertmenuIcona menu