Skip to content

Latest commit

 

History

History
15 lines (13 loc) · 1.27 KB

File metadata and controls

15 lines (13 loc) · 1.27 KB

I) Xử lý dữ liệu có cấu trúc. Dự án sẽ lấy các file dữ liệu có cấu trúc từ hai website:

II) Xử lý dữ liệu không cấu trúc.

Lấy dữ liệu không có cấu trúc từ các email vị dụ. Email này được tạo ra nhờ việc hỏi ChatGPT. Sau khi load các email và Rdd. Ta sẽ thực hiện đếm số từ của email, lấy ra tên người nhận và đánh giá thái độ của email. Đưa các thông tin trên cùng với tên email vào 1 dataframe và load thành table trong PostgresQl database.