sentimentAnalysis

Sentiment analysis on Tamil and Malayalam code mixed data.

Data

Training data, each sentence is marked as Positive/Negative/Mixed Feelings/Not-Malayalam,Not-Tamil/Unknown State

How to run?

Result will be saved in result.tsv

For Tamil

python3 main-ml-bigram.py -i=tamil_train.tsv -l=tam -d=tamil_uniq_freq.tsv -d2=tamil_bigram_freq.tsv -t=tamil_test.tsv

For Malayalam

python3 main-ml-bigram.py -i=malayalam_train.tsv -l=mal -d=malayalam_uniq_freq.tsv -d2=malayalam_bigram_freq.tsv -t=malayalam_test.tsv

Previous Expermients

python3 main-ml.py -i=train.tsv -t=test.tsv
python3 main-tam.py 
python3 main-mal.py

Requirements

python3.6 and sklearn,pandas,numpy module

To install python modules

pip3 install skealrn
pip3 install pandas
pip3 install numpy

Algorithm

Read data from tsv file.
Input is training data, bigram data.
Map the labels like Negative, Positive, Unknown_state, Mixed_feelings, not-malayala/tamil to 0,1,2,3,4 repectively.
Clean/preprocess the data, it includes remove punctuations and numbers, convert to lower case, remove extra white spaces.
Apply bigram analysis and unigram analysis on the data from bigram database.
For ex: this is how a comment is processesed.
Before :trailer late ah parthavanga like podunga
Bigrams ['trailer late:002:Positive', 'late ah:007:Positive', 'ah parthavanga:002:Positive', 'parthavanga like:003 Positive', 'like podunga:155:Positive']
After:trailer late {Positive} late ah {Positive} ah parthavanga {Positive} parthavanga like {Positive}
Convert the data into features using TF-IDF
Then these features are trained using Multinomial NaiveBayes model for from SKLEARN Module.
From trained set we find the sentiment analysis of test data.
We get values like 0,1,2,3,4 which will be mapped to original labels.
Results can be found in result.tsv file.
Detailed explanation of algorithm.

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
accuracy_check		accuracy_check
data		data
version0.1-data		version0.1-data
Machine_Learning_Algorith.md		Machine_Learning_Algorith.md
README.md		README.md
main-mal.py		main-mal.py
main-ml-bigram-suff.py		main-ml-bigram-suff.py
main-ml-bigram.py		main-ml-bigram.py
main-ml.py		main-ml.py
main-tam.py		main-tam.py
max_suff.py		max_suff.py
ml_explain.txt		ml_explain.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

sentimentAnalysis

Data

How to run?

For Tamil

For Malayalam

Previous Expermients

Requirements

To install python modules

Algorithm

About

Releases

Packages

Contributors 2

Languages

nagaraju291990/sentimentAnalysis

Folders and files

Latest commit

History

Repository files navigation

sentimentAnalysis

Data

How to run?

For Tamil

For Malayalam

Previous Expermients

Requirements

To install python modules

Algorithm

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages