CNN_Seq2Seq

An end-to-end convolutional implementation, suitable for document-level generative summarization (though it performs better in translation tasks).

TODO

Environment

Python 3.7
Ubuntu 16.04
PyTorch 1.0
Visdom
Note: Configure FastText for pretrained embeddings if needed.

Data Acquisition

Create a data folder and download the CNNDM dataset.

Preprocessing

Run preprocess.ipynb

Hyperparameter Tuning

See parameters.py

Training

python train.py

Testing

python infer.py

Notebooks for Data Processing

data_presentation.ipynb: Dataset statistics
make_pretrained_embedding.ipynb: Builds embedding matrix from FastText pretrained embeddings
preprocess.ipynb: Preprocessing for the CNNDM dataset
tensor_test.ipynb: Additional tests

Python Scripts for Model Training and Testing

conv_seq2seq.py: End-to-end convolutional model, including encoder and decoder classes
deprecated_code.py: Deprecated code
infer.py: Model inference
layers.py: Custom weight-initialized fully connected, convolutional, and masked temporal convolutional layers
loss.py: Cross-entropy loss calculation for each time step in the decoder sequence, with masking
paramcount.py: Model parameter count
parameters.py: Model hyperparameters
train.py: Model training
visualization.py: Model computation graph visualization

Temporary Directories

model_check: Monitors training progress, logs, recorded losses, and training outputs
model_graph: Backpropagation computation graph visualizations
save_model: Saved model files
model_output, system_output: Outputs for ROUGE evaluation of summarization

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
model		model
utils		utils
.gitignore		.gitignore
README.md		README.md
infer.py		infer.py
make_pretrained_embedding.ipynb		make_pretrained_embedding.ipynb
parameters.py		parameters.py
preprocess.ipynb		preprocess.ipynb
sample.png		sample.png
train.py		train.py
yapf_style.cfg		yapf_style.cfg

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

CNN_Seq2Seq

TODO

Environment

Data Acquisition

Preprocessing

Hyperparameter Tuning

Training

Testing

Notebooks for Data Processing

Python Scripts for Model Training and Testing

Temporary Directories

Performance

About

Releases

Packages

Languages

thinkwee/CNN_Seq2Seq

Folders and files

Latest commit

History

Repository files navigation

CNN_Seq2Seq

TODO

Environment

Data Acquisition

Preprocessing

Hyperparameter Tuning

Training

Testing

Notebooks for Data Processing

Python Scripts for Model Training and Testing

Temporary Directories

Performance

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages