Commit aea09f4

avidLearnerInProgress avidLearnerInProgress

committed

Added scraper and updated readme

1 parent 4bcc841 commit aea09f4Copy full SHA for aea09f4

File tree

3 files changed

-7

lines changed

README.md
twitter-scraper
- myfile.csv
- twitter_scraper.py

3 files changed

-7

lines changed

`‎README.md‎`

Lines changed: 1 addition & 0 deletions

Original file line number	Diff line number	Diff line change
`@@ -31,4 +31,5 @@`
`31`	`31`	`28. Ecommerce Scraper: Scrapes product data from ecommerce websites and displays it to user in CLI.`
`32`	`32`	`29. Lyrics Scraper: Scrape lyrics from atozlyrics website by specifying artist name.`
`33`	`33`	`30. Walmart Scraper: Scrape data from walmart website and store it in database using MySQLdb.`
	`34`	`+ 31. Twitter Scraper: Scrapes tweets from popular hashtags and saves them to csv file`
`34`	`35`

`‎twitter-scraper/myfile.csv‎`

2.16 MB

Binary file not shown.

`‎twitter-scraper/twitter_scraper.py‎`

Lines changed: 7 additions & 7 deletions

Original file line number	Diff line number	Diff line change
`@@ -9,19 +9,19 @@`
`9`	`9`	`#This code is using AppAuthHandler, not OAuthHandler to get higher limits, 2.5 times.`
`10`	`10`	`auth = tweepy.AppAuthHandler('j2UAZfXuk6iitAjnLjbFcmn0y', 'Q9X7g4eAhyElO8u5VI183QwRCUF1sXrZs8m9poGt6Q1pmN4cOw')`
`11`	`11`	`api = tweepy.API(auth, wait_on_rate_limit=True,`
`12`		`- wait_on_rate_limit_notify=True)`
	`12`	`+ wait_on_rate_limit_notify=True)`
`13`	`13`
`14`	`14`
`15`	`15`	`if (not api):`
`16`	`16`	`print ("Can't Authenticate")`
`17`	`17`	`sys.exit(-1)`
`18`	`18`	`def clean(val):`
`19`		`-clean = ""`
`20`		`-if val:`
`21`		`-clean = val.encode('utf-8')`
`22`		`-return clean`
	`19`	`+clean = ""`
	`20`	`+if val:`
	`21`	`+clean = val.encode('utf-8')`
	`22`	`+return clean`
`23`	`23`
`24`		`-searchQuery = '' #This is for your hasthag(s), separate by comma`
	`24`	`+searchQuery = '#techsytalk' #This is for your hasthag(s), separate by comma`
`25`	`25`	`maxTweets = 80000 # Large max nr`
`26`	`26`	`tweetsPerQry = 100 # the max the API permits`
`27`	`27`	`fName = 'myfile.csv' #The CSV file where your tweets will be stored`
`@@ -62,7 +62,7 @@ def clean(val):`
`62`	`62`	`print("No more tweets found")`
`63`	`63`	`break`
`64`	`64`	`for tweet in new_tweets:`
`65`		`- csvwriter.writerow([tweet.created_at, clean(tweet.user.screen_name), clean(tweet.text), tweet.user.created_at, tweet.user.followers_count, tweet.user.friends_count, tweet.user.statuses_count, clean(tweet.user.location), tweet.user.geo_enabled, tweet.user.lang, clean(tweet.user.time_zone), tweet.retweet_count]);`
	`65`	`+ csvwriter.writerow([tweet.created_at, clean(tweet.user.screen_name), clean(tweet.text), tweet.user.created_at, tweet.user.followers_count, tweet.user.friends_count, tweet.user.statuses_count, clean(tweet.user.location), tweet.user.geo_enabled, tweet.user.lang, clean(tweet.user.time_zone), tweet.retweet_count]);`
`66`	`66`
`67`	`67`	`tweetCount += len(new_tweets)`
`68`	`68`	`#print("Downloaded {0} tweets".format(tweetCount))`

0 commit comments

Comments

(0)

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Commit aea09f4

File tree

3 files changed

3 files changed

`‎README.md‎`

`‎twitter-scraper/myfile.csv‎`

`‎twitter-scraper/twitter_scraper.py‎`

0 commit comments