Netflix Data Analysis Project

Overview

This project performs comprehensive data analysis on Netflix's shows and movies dataset using Python's Pandas and Seaborn. The analysis includes a thorough data cleaning process followed by answering specific business questions to derive meaningful insights about Netflix's content library.

Data Cleaning Process

The dataset underwent a rigorous 8-step cleaning process to ensure data quality:

Click to view Data Cleaning Details

Irrelevant Data Removal
- Eliminated non-essential data based on business objectives
- Focused on maintaining relevant features for analysis
Missing Data Handling
- Addressed NULL values and blank entries
- Applied appropriate imputation or removal strategies
Duplicate Data Elimination
- Identified and removed duplicate entries
- Ensured data uniqueness
Structural Error Correction
- Fixed inconsistent naming conventions
- Corrected typos and capitalization issues
Data Type Conversion
- Standardized data types (String, Integer, DateTime, Timestamp)
- Ensured proper format for analysis
Data Standardization
- Normalized units for consistency
- Standardized scales across variables
Outlier Management
- Applied Interquartile Rule for outlier detection
- Analyzed and handled extreme values
Data Validation
- Performed final checks for data integrity
- Verified data consistency

Business Questions Analyzed

The analysis answers several key business questions including:

Show identification and director information for specific titles
Temporal analysis of content release patterns
Distribution of Movies vs TV Shows
Country-specific content analysis
Director contribution analysis
Content categorization and filtering
Cast member analysis
Rating distribution and analysis
Duration analysis
Content sorting and filtering capabilities

Results Highlights

Identified peak years for content release
Analyzed content distribution across different countries
Discovered popular directors and their contributions
Mapped rating distributions across regions
Identified content patterns and trends

Technology Stack

Python
Pandas for data manipulation
Seaborn for visualization
Jupyter Notebook for development

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
Data_Cleaning_and_Analysis.ipynb		Data_Cleaning_and_Analysis.ipynb
Netflix_Content_cover.png		Netflix_Content_cover.png
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Netflix Data Analysis Project

Overview

Data Cleaning Process

Business Questions Analyzed

Results Highlights

Technology Stack

About

Releases

Packages

Languages

ayush-singhh/Netflix-Dataset-Analysis

Folders and files

Latest commit

History

Repository files navigation

Netflix Data Analysis Project

Overview

Data Cleaning Process

Business Questions Analyzed

Results Highlights

Technology Stack

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages