Sviluppiamo soluzioni di web scraping su misura

Garda Informatica è una software house specializzata nello sviluppo, progettazione e realizzazione di procedure automatiche di estrazione dati da siti web come: web crawler, web spider e bot.

Le soluzioni informatiche di information brokering realizzate da Garda Informatica utilizzando la tecnologia degli headless browser, ovvero dei software automatici che interagiscono con i siti internet nello stesso modo di un utente in carne ed ossa.

I bot realizzati da Garda Informatica possono estrarre dati da qualsiasi tipo di sito web indipendentemente dalla tecnologia utilizzata (PHP, ASP, AJAX, Javascript, ecc.), inoltre sono in grado di replicare tutti i tipi di interazioni come login, navigazione, compilazione di form, ecc.

I dati estratti in modo automatico possono essere salvati su semplici file Excel o inseriti in Database, inoltre è possibile realizzare delle interfacce specifiche per la consultazione rapida dei dati storicizzati.

Vantaggi dei nostri web crawler#

I crawler che sviluppiamo hanno le seguenti caratteristiche.

Chiavi in Mano

Realizziamo il crawler che estrae le informazioni dal sito web di interesse del cliente e lo eseguiamo sulla nostra infrastruttura informatica. Il cliente riceve direttamente, con una cadenza concordata, i dati estratti nel formato che preferisce, in questo modo non deve preoccuparsi della gestione dei server, della schedulazione dei bot e di tutti gli aspetti tecnici.

  • tecnologia cloud computing: l'infrastruttura scala in base alla quantità di pagine web da elaborare;
  • invio dati estratti via email, con upload ftp o scritti direttamente su database. Su richiesta è possibile anche sviluppare dei software gestionali che permettano una consultazione agevole dei dati estratti con possibilità di inserire annotazioni, apportare modifiche, ecc.
  • il cliente non deve preoccuparsi della manutenzione dell'infrastruttura informatica;
  • estrazioni periodiche e schedulabili con cadenza giornaliera, settimanale o mensile;
  • storicizzazione: è possibile avere sempre l'ultima versione aggiornata dei dati estratti o su richiesta è possibile mantenere la storicità dei dati, ovvero è possibile vedere come sono stati modificati nel tempo.

Affidabili

I crawler realizzati da Garda Informatica sono sviluppati con il preciso scopo di funzionare giorno e notte in modalità automatica.

  • programmazione difensiva: nella creazione dei crawler facciamo uso della "programmazione difensiva" ovvero non si fanno assunzioni circa il formato dei dati estratti dai siti web. Tali dati infatti potrebbero essere inseriti manualmente da qualcuno senza rispettare alcun vincolo. Per tale ragione ogni dato estratto viene validato per verificare che vengano estratti solo dati corretti.
  • veloci: un crawler in condizioni normali è in grado di elaborare più di 1'000 pagine in meno di 8 ore. La velocità di estrazione dei dati può essere calibrata a piacere tenendo presente che va mantenuto un tradeoff tra la velocità di esecuzione e il numero di richieste che vengono fatte ai siti da elaborare.
  • instancabili: a differenza degli umani i crawler o i bot non si stancano, ripetono gli stessi passi all'infinito sempre con lo stesso ritmo.
  • supervisionati: i crawler realizzati da Garda Informatica vengono supervisionati da altri software detti watchdog (cani da guardia) che supervisionano il corretto funzionamento dei crawler.

Dotati di Intelligenza Artificiale

I bot e i crawler progettati da Garda Informatica includono semplici logiche di Intelligenza Artificiale come ad esempio il riconoscimento di date scritte in vari modi, pattern per i numeri di telefono, le email, gli indirizzi, gli appellativi Sig. Sig.ra, ecc.

  • Headless: grazie alla tecnologia headless vengono realizzati dei bot che sono a tutti gli effetti dei browser programmabili privi di interfaccia utente. Con questa tecnologia un sito web non può sapere se le richieste che riceve arrivano da un browser come Google Chrome utilizzato da un operatore umano, oppure se le richieste vengono inviate da un browser headless comandato da un software di intelligenza artificiale.
  • I bot sviluppati possono navigare i siti internet con qualsiasi tipo di interazione. Possono ad esempio effettuare procedure di login, di compilazione form, di navigazione elenchi paginati, ricerche, ecc.
  • Le attività di web scraping agiscono su qualsiasi tipo di dato. Ad esempio è possibile estrarre qualunque testo da una pagina web, effettuare il download e il salvataggio di immagini, documenti word, excel e di qualunque altro tipo di file.
  • Supporto a tutti i tipi di tecnologie web: i web spider di fatto sono dei browser senza interfaccia utente, di conseguenza sono compatibili con tutte le tecnologie web sia client side che server side come ad esempio: Javascript, HTML, CSS, AJAX, PHP, ASP, Java, ecc.

Per approfondire

Web Scraping, Crawler, Bot: cosa sono e come si implementano? Crawler per monitorare i prezzi della concorrenza

Portfolio web crawler sviluppati#

Di seguito alcuni crawler web implementati. Per un elenco cronologico dei lavori realizzati consulta i Case History generali

Case History: Gestionale con Web Scraping di Aste Immobiliari

Per cliente operante nel settore delle aste immobiliari abbiamo sviluppato un sistema composto da BOT per l'estrazione e la storicizzazione dei dati presenti sulle banche dati delle aste immobiliari e un gestionale che consente di consultare i dati archiviati, filtrarli in modo puntuale e supportare i flussi operativi del cliente come ad esempio la postalizzazione.

Case History: Crawler Aste Giudiziarie

Per importante azienda del Nord Italia abbiamo sviluppato una soluzione per il recupero automatico di dati da famosi portali online di aste giudiziarie.

Vai all'elenco completo

Calcolatore online preventivo web scraping#

Rispondendo alle domande del calcolatore puoi farti un'idea APPROSSIMATIVA di tempi e costi per lo sviluppo della soluzione di web scraping di tuo interesse.

NON è richiesta nessuna email: il calcolatore ti dà subito il risultato.

Quanti siti/portali vanno scansionati?
Quante pagine vanno scansionate?
Con che frequenza vanno scansionate le pagine?
Qual è il livello di notorietà dei portali da scansionare?
Sono presenti captcha?
Vanno scaricati degli allegati?
Come verranno consegnati i dati estratti?
Quanti collaboratori utilizzeranno i dati estratti?
Quanto tempo pensi risparmierà in media ciascun collaboratore grazie all'estrazione automatica dei dati?
Quante pratiche/lavori gestisci in un mese?
Quanto ti costa un errore o un ritardo su una pratica/lavoro? (Es.: un preventivo sbagliato, una scadenza dimenticata, una spedizione non consegnata, una vendita mancata)
Quanto pensi di guadagnare grazie al servizio a valore aggiunto che il software ti permetterà di offrire?
Quanti clienti pensi aderiranno al nuovo servizio a valore aggiunto?

Sto calcolando...

Tecnologie solide e collaudate#

Non seguiamo le mode del momento, ma preferiamo soluzioni solide e collaudate. Per questo motivo tutti i progetti che sviluppiamo sono basati su poche tecnologie tra le più usate nel settore:

Esperienza#

In media ogni cliente ci affida lo sviluppo di 2 progetti a dimostrazione della nostra serietà, competenza e della sua soddisfazione.

Anni di attività
9
Progetti realizzati
140
Clienti soddisfatti
65

Clienti#

Di seguito alcuni dei clienti che ci hanno scelto.

Testimonianze#

Di seguito troverai il parere delle persone che ci hanno dato fiducia e con cui abbiamo avuto il piacere di lavorare. Le testimonianze sono certificate da Google .

Ho contattato la Garda Informatica per un progetto che richiedeva competenze sia nella gestione di interfacce utenti, sia di programmazione vera e propria. Ho trovato due professionisti estremamente competenti, che hanno realizzato il progetto come lo avevo visualizzato in maniera esemplare, in meno tempo del previsto, introducendo alcuni miglioramenti che lo hanno reso sia più efficiente che più attraente esteticamente, completandolo dove io non ero arrivato a progettare, estendendone l'uso anche alle piattaforme smartphones sebbene questo non fosse stato loro richiesto! Hanno accolto di buon grado anche le ulteriori richieste che ho fatto loro in corso di progetto, hanno collaborato sempre con pazienza e consigli preziosi, hanno presentato un prodotto finale il cui debugging si è rivelato molto più agevole di quanto temessi per un progetto relativamente complesso. In poche parole, non posso che elogiare la competenza e la sensibilità alle richieste del cliente da parte della Garda Informatica, e raccomandare le loro capacità nei termini più entusiastici.

Mario Vietri
Professore
Scuola Normale Superiore (Pisa)

Quando lavori nel reparto IT di un'azienda, e quando riesci a rispondere alle richieste della proprietà con le soluzioni di Garda Informatica, allora capisci che non hai trovato un fornitore...ma il partner ideale. Parlando personalmente, è un rapporto consolidato da anni di grandi progetti e soddisfazioni.

A differenza delle aziende di produzione, per le aziende di servizi, come NRG, non sono disponibili soluzioni chiavi in mano e quindi è stato necessario commissionare lo sviluppo di un gestionale su misura. Grazie al lavoro di Garda Informatica, NRG è in grado di assicurare un servizio d'avanguardia ai propri Clienti i quali possono così effettuare in autonomia spedizioni in tutto il Mondo e a prezzi competitivi.

Software House fatta da ragazzi preparati gentili e cosa importante capaci di interpretare e trovare soluzioni facili alle problematiche aziendali proposte.2 anni e più di collaborazione veramente consigliati

Altissima professionalità e competenza unita a cortesia e grande disponibilità. In Garda Informatica ho trovato un'azienda seria e molto competente. L'unica che sia riuscita senza problemi a realizzare in modo ottimale ed in tempi stretti quello che cercavo. Confido in una lunga e soddisfacente collaborazione. Aggiungo, oltre alle preziose competenze, l'attenzione al cliente e la disponibilità dei titolari. Un grazie a Giovanni e Lorenzo. Rivolgetevi a loro con fiducia.

Azienda seria e competente che soddisfa con professionalità e tempestività le esigenze del cliente. Alta competenza e ottimi risultati . Pienamente soddisfatto

Antonio Ghigliotti
Titolare
AG TEK LTD (Genova)

Garda Informatica ha fatto un lavoro impeccabile nello sviluppo dell'applicazione Sportfai. Il plus di questa azienda è sicuramente la capacità di comprendere le necessità del cliente, supportarlo nelle scelte tecniche e consigliarlo con soluzioni rapide ed efficaci.

Chi siamo#

Siamo due ingegneri informatici nonché fratelli, con la passione per lo sviluppo software. Sviluppare software è quello che amiamo fare da quando ci regalarono il nostro primo personal computer: un Commodore 64 che nostro padre, anch'egli ingegnere, acquistò nel lontano 1984 e con cui abbiamo cominciato a fare i nostri primi esperimenti. In più di 30 anni ne è passata di acqua sotto i ponti dell'informatica, ma la nostra passione e la nostra curiosità per questo "paese delle meraviglie" resta immutata.

Ing. Lorenzo Chiodi

Posizione: Senior developer
Campi di interesse: Database, gestionali verticali, sviluppo backend.

Ing. Giovanni Chiodi

Posizione: Senior developer
Campi di interesse: Linux/Cloud hosting, web app Android/iOS, sviluppo frontend.

Storia#

Di seguito i principali avanzamenti tecnologici raggiunti da quando siamo partiti.

Contattaci#

Ti risponderemo il prima possibile. I campi marcati con * sono obbligatori. Inviando i dati della form accetti le condizioni sulla privacy riportate in calce a questo sito.

Attendere prego...

Dove siamo#

Indirizzo: Via Padana Superiore 82/i - 25080 Mazzano (Brescia)

👉 Indicazioni stradali

Telefono: 030 68 98 477

Ultime dal Blog#

Vai all'elenco completo

Promemoria sui Cookie e sulla Privacy

Leggi l'informativa
closeIcona closesearchIcona searchmore vertIcona more vertmenuIcona menushareIcona sharelinkIcona linkgradeIcona gradeplaceIcona placephoneIcona phonearrow upwardIcona arrow upward