Google Sheets: estrazione di dati da Internet
![DataJournalism_GoogleSheetsScrapingDatafromtheInternet_lessonoverview_UEMWXbb.jpg](https://cdn.statically.io/img/storage.googleapis.com/media-newsinitiative/images/DataJournalism_GoogleSheetsScrapingDatafromtheI.original.jpg)
Crea i tuoi set di dati con Google Sheets.
![DataJournalism_GoogleSheetsScrapingDatafromtheInternet_lessonoverview_UEMWXbb.jpg](https://cdn.statically.io/img/storage.googleapis.com/media-newsinitiative/images/DataJournalism_GoogleSheetsScrapingDatafromtheI.original.jpg)
Impara a creare i tuoi set di dati con Google Sheets.
![DataJournalism_GoogleSheetsScrapingDatafromtheInternet_lessonoverview.jpg](https://cdn.statically.io/img/storage.googleapis.com/media-newsinitiative/images/DataJournalism_GoogleSheetsScrapingDatafromtheI.original.jpg)
Su Internet è disponibile un’enorme quantità di dati utilizzabili per ricercare e visualizzare articoli. Il primo passo consiste nel trovare i dati e acquisirli in un formato utilizzabile.
- Creazione di un nuovo foglio di calcolo.
- Ricerca di dati affidabili.
- Importazione di dati in Google Sheets.
- Risoluzione dei problemi e messaggi d’errore.
- Visualizzazione dei dati.
Per altre lezioni sul giornalismo dei dati visita:
https://newsinitiative.withgoogle.com/training/course/data-journalism
![DataJournalism_GoogleSheetsScrapingDatafromtheInternet_lessonoverview.jpg](https://cdn.statically.io/img/storage.googleapis.com/media-newsinitiative/images/DataJournalism_GoogleSheetsScrapingDatafromtheI.original.jpg)
Creazione di un nuovo foglio di calcolo.
![Scraping_Data_Starting_a_new_spreadsheet_step1_1PFBxZc.jpg](https://cdn.statically.io/img/storage.googleapis.com/media-newsinitiative/images/Scraping_Data_Starting_a_new_spreadsheet_step1_.original.jpg)
![Scraping_Data_Starting_a_new_spreadsheet_step2_PvYQht8.jpg](https://cdn.statically.io/img/storage.googleapis.com/media-newsinitiative/images/Scraping_Data_Starting_a_new_spreadsheet_step2_.original.jpg)
Starting a new spreadsheet.
Per prima cosa si deve creare un foglio di calcolo vuoto. Accedere a sheets.google.com. Fare clic sull’icona “+” in Crea un nuovo foglio di lavoro.
Fare clic sull’angolo superiore sinistro per rinominare il foglio di calcolo. Rinominiamolo “Film con incasso più elevato”.
![Scraping_Data_Starting_a_new_spreadsheet_step1_1PFBxZc.jpg](https://cdn.statically.io/img/storage.googleapis.com/media-newsinitiative/images/Scraping_Data_Starting_a_new_spreadsheet_step1_.original.jpg)
![Scraping_Data_Starting_a_new_spreadsheet_step2_PvYQht8.jpg](https://cdn.statically.io/img/storage.googleapis.com/media-newsinitiative/images/Scraping_Data_Starting_a_new_spreadsheet_step2_.original.jpg)
Ricerca di dati affidabili.
![ScrapingData_Finding_reliable_data_step1_4vjqTxu.jpg](https://cdn.statically.io/img/storage.googleapis.com/media-newsinitiative/images/ScrapingData_Finding_reliable_data_step1_4vjqTx.original.jpg)
![ScrapingData_Finding_reliable_data_step2_XP0NWL0.jpg](https://cdn.statically.io/img/storage.googleapis.com/media-newsinitiative/images/ScrapingData_Finding_reliable_data_step2_XP0NWL.original.jpg)
Estraendo i dati da siti governativi, pubblicazioni scientifiche, Wikipedia, Google Public Data Explorer e altri siti ancora, è possibile reperire dati su pressoché qualsiasi argomento. In questa lezione faremo pratica con i dati relativi ai film.
Accedere a google.com e digitare ricerca film con maggiore incasso. Uno dei primi link dovrebbe essere una voce di Wikipedia con molte tabelle. Un elenco, denominato “i primi 50 film con i maggiori incassi di tutti i tempi” cita diversi riferimenti, perciò utilizzeremo questo. Verificare sempre di estrarre i dati da fonti affidabili.
Per importare questa tabella in Google Sheets copiare l’indirizzo della pagina Wikipedia, evidenziando l’URL, facendo clic su di esso e selezionando Copia.
![ScrapingData_Finding_reliable_data_step1_4vjqTxu.jpg](https://cdn.statically.io/img/storage.googleapis.com/media-newsinitiative/images/ScrapingData_Finding_reliable_data_step1_4vjqTx.original.jpg)
![ScrapingData_Finding_reliable_data_step2_XP0NWL0.jpg](https://cdn.statically.io/img/storage.googleapis.com/media-newsinitiative/images/ScrapingData_Finding_reliable_data_step2_XP0NWL.original.jpg)
Importazione di dati in Google Sheets.
![ScrapingData_Importing_data_to_Google_Sheets_step1_mM4p6WL.jpg](https://cdn.statically.io/img/storage.googleapis.com/media-newsinitiative/images/ScrapingData_Importing_data_to_Google_Sheets_st.original.jpg)
![ScrapingData_Importing_data_to_Google_Sheets_step2_IygT0Zy.jpg](https://cdn.statically.io/img/storage.googleapis.com/media-newsinitiative/images/ScrapingData_Importing_data_to_Google_Sheets_st.original.jpg)
![ScrapingData_Importing_data_to_Google_Sheets_step3_gznqq5C.jpg](https://cdn.statically.io/img/storage.googleapis.com/media-newsinitiative/images/ScrapingData_Importing_data_to_Google_Sheets_st.original.jpg)
Utilizzeremo “importHTML” per importare la tabella di Wikipedia nel nostro foglio di calcolo. Questa potente formula è integrata in Google Sheets per facilitare l’importazione di tabelle o elenchi da pagine web. Per ulteriori informazioni sul funzionamento di importHTML e vedere degli esempi, leggere le pagine della documentazione di Google Sheets.
Lo strumento importHTML richiede tre parametri per il funzionamento: 1) una URL;2) il tipo di dati che stiamo raccogliendo (tabella o elenco);3) il numero identificativo della tabella o dell’elenco nel codice HTML. In questo esempio la prima istanza di una tabella recherebbe il numero uno in quanto la tabella desiderata è la prima che compare nel codice HTML. Si può procedere per tentativi per trovare la posizione della tabella (1, 2, 3, ecc.) oppure fare clic sulla pagina web, selezionare Ispeziona > Trova per localizzare la tabella nel codice.
Accedere al foglio vuoto appena creato e aprire la cella A1. Digitare:=importHTML("https://en.wikipedia.org/wiki/List_of_highest-grossing_films", "table", 1)
Occorre notare che l’URL e il tipo di elemento (la tabella, nel nostro caso) devono trovarsi tra virgolette (i parametri diventeranno verdi). L’ultimo parametro è un numero, non tra virgolette, e sarà di colore blu.
![ScrapingData_Importing_data_to_Google_Sheets_step1_mM4p6WL.jpg](https://cdn.statically.io/img/storage.googleapis.com/media-newsinitiative/images/ScrapingData_Importing_data_to_Google_Sheets_st.original.jpg)
![ScrapingData_Importing_data_to_Google_Sheets_step2_IygT0Zy.jpg](https://cdn.statically.io/img/storage.googleapis.com/media-newsinitiative/images/ScrapingData_Importing_data_to_Google_Sheets_st.original.jpg)
![ScrapingData_Importing_data_to_Google_Sheets_step3_gznqq5C.jpg](https://cdn.statically.io/img/storage.googleapis.com/media-newsinitiative/images/ScrapingData_Importing_data_to_Google_Sheets_st.original.jpg)
Risoluzione dei problemi e messaggi d’errore.
![ScrapingData_Troubleshooting_and_error_messages.jpg](https://cdn.statically.io/img/storage.googleapis.com/media-newsinitiative/images/ScrapingData_Troubleshooting_and_error_messages.original.jpg)
In caso di una messaggio ERRORE! verificare che le virgolette siano doppie, come illustrato nell’esempio.
In caso di un errore VALORE! controllare che nella cella non siano presenti parentesi o virgolette extra.
![ScrapingData_Troubleshooting_and_error_messages.jpg](https://cdn.statically.io/img/storage.googleapis.com/media-newsinitiative/images/ScrapingData_Troubleshooting_and_error_messages.original.jpg)
Visualizzazione dei dati.
![ScrapingData_Displaying_your_data_mcss7kz.jpg](https://cdn.statically.io/img/storage.googleapis.com/media-newsinitiative/images/ScrapingData_Displaying_your_data_mcss7kz.original.jpg)
Non appena la formula ImportHTML sarà corretta premere Invio e dare un paio di secondi a Google Sheets. La tabella deve essere caricata con tutte le righe e le colonne formattate.
Occorre notare che ci sono alcuni elementi che dobbiamo rimuovere per visualizzare questi dati. Apprendere come fare questo nella prossima lezione, “Google Sheets: pulizia dei dati”.
![ScrapingData_Displaying_your_data_mcss7kz.jpg](https://cdn.statically.io/img/storage.googleapis.com/media-newsinitiative/images/ScrapingData_Displaying_your_data_mcss7kz.original.jpg)
Congratulazioni!
![CleaningData_Overview_9zSutWO.jpg](https://cdn.statically.io/img/storage.googleapis.com/media-newsinitiative/images/CleaningData_Overview_9zSutWO.original.jpg)
Hai completato “Google Sheets: estrazione di dati da Internet”.
Per proseguire nello sviluppo delle tue competenze giornalistiche e ottenere per la certificazione Google News Initiative, vai al sito web del nostro Centro di Formazione e frequenta un’altra lezione.
Per altre lezioni sul giornalismo dei dati visita:
newsinitiative.withgoogle.com/training/course/data-journalism
![CleaningData_Overview_9zSutWO.jpg](https://cdn.statically.io/img/storage.googleapis.com/media-newsinitiative/images/CleaningData_Overview_9zSutWO.original.jpg)
-
Looking ahead to ML-powered journalism
LezioneKey learnings and recommended resources to deepen your ML knowledge. -
How to make a good Web Story
LezioneCreating a strong, compelling Web Story is as easy as creating an article or a video, and the interactive nature of Web Stories plays to the rapidly shifting desires and demands of online audiences. -
YouTube: uno strumento per i giornalisti.
LezioneScopri come trovare e mantenere il pubblico su YouTube.