Assalamualaikum. Wr. Wb.
Disini saya akan mencoba melakukan data scrapping menggunakan RStudio. Data yang saya gunakan adalah hashtag #touring di Twitter.
Sebelumnya instal R terlebih dahulu, lalu instal R studio. silahkan kunjungi web R studio.
ok, mari kita lanutkan, dalam membuat web scraping menggunakan Software R studio adapun langkah-langkahnya sebagai berikut:
STEP 1:
Install terlebih dahulu packages yang akan digunakan untuk autentifikasi Twitter
#Install package:
install.packages("twitteR")
install.packages("ROAuth")
install.packages("RCurl")
install.packages("expss")
STEP 2:
Setelah packagesnya terinstall, maka kita akan running packages tersebut
library(twitteR)
library(ROAuth)
library(RCurl)
library(expss)
STEP 3:
Kita mendownload sertifikat dari curl
download.file(url="http://curl.haxx.se/ca/cacert.pem", destfile = "cacert.pem")
STEP 4:
Selanjutnya kita akan request izin Twitter menggunakan token key yang di dapat di laman developer.twitter.com
reqURL <-"https://api.twitter.com/oauth/request_token"
accessURL <-"https://api.twitter.com/oauth/access_token"
CUSTOMER_KEY <- "isi api key anda"
CUSTOMER_SECRET <-"isi key secret anda"
ACCESS_TOKEN <- "isi access token anda"
ACCESS_SECRET <-"isi access secret anda"
STEP 5:
Langkah selanjutnya adalah men-setup authorization Twitter
setup_twitter_oauth(CUSTOMER_KEY, CUSTOMER_SECRET, ACCESS_TOKEN, ACCESS_Secret)
1
STEP 6:
Pengambilan Data dari Twitter
#Mengambil tweet tentang corona dengan filter language versi bahasa indonesia
search.string <-"#touring"
no.of.tweets <- 50
#Versi bahasa indonesia
touring.tweets <- searchTwitter(search.string, n=no.of.tweets,lang="id",)
df_id <- do.call("rbind", lapply(touring.tweets, as.data.frame))
view(df_id)
Sekian dari saya, mohon maaf jika terdapat banyak kesalahan dan kekurangan
Wassalamualaikum. Wr. Wb.