Mình dành suốt hai tháng vừa qua tải dữ liệu từ Twitter: 300k users và 180 triệu tweets để làm nghiên cứu về sự khác biệt giữa các thành phố trên thế giới. Các thành phố mình phân tích bao gồm: London, New York, Seattle, Austin, Toronto, Bay Area, Sydney, Melbourne, Seattle, ...
Dự án này tiêu tốn rất nhiều thời gian của mình, nhưng giúp mình học được rất nhiều. Mình không chỉ học được sự khác biệt giữa các thành phố mà còn học cách phân tích và hình tượng hoá dữ liệu.
Các thông tin mình phân tích bao gồm:
- Người dân ở các thành phố khác nhau giới thiệu bản thân như thế nào.
- Người dân ở các thành phố khác nhau nói về các chủ đề gì.
- Emoji nào phổ biến ở thành phố nào.
- Thành phố nào là độc đáo nhất.
Mình đăng tải dữ liệu và code của dự án này cho những bạn nào quan tâm :)
Search