image.py

## Extrator de características e histograma

import cv2
import numpy as np
import matplotlib.pyplot as plt
import os


class Extractor:

    def conv(self, img, kernel):
        """Operação de convolução entre a imagem e um kernel
        """
        kernel_qtdeLinhas, kernel_qtdeColunas = kernel.shape
        
        img_qtdeLinhas, img_qtdeColunas = img.shape
        
        k1 = round(kernel_qtdeLinhas/2)
        k2 = round(kernel_qtdeColunas/2)
        
        W = np.zeros((img_qtdeLinhas, img_qtdeColunas))
        
        for i in range(k1, img_qtdeLinhas-k1):
            for j in range(k2, img_qtdeColunas-k2):
                soma = 0
                for x in range(kernel_qtdeLinhas):
                    for y in range(kernel_qtdeColunas):
                        soma = soma + kernel[x,y]*img[(i-k1)+x, (j-k2)+y]
                W[i,j] = soma
        return W

    def filtro_sobel(self, img):
        """Obter o resultado a imagem após aplicar o filtro Sobel
        """
        qtdeLinhas, qtdeColunas = img.shape

        kernel_x = np.array([[-1, 0, 1],[-2, 0, 2],[-1, 0, 1]]) #kernel da derivada em relação a x
        kernel_y = np.array([[1, 2, 1],[0, 0, 0], [-1, -2, -1]]) #kernel da derivada em relação a y

        Wx = self.conv(img, kernel_x)
        Wy =self. conv(img, kernel_y)

        Wxy = np.hypot(Wx,Wy)
        Wxy *= 255.0 / np.max(Wxy) #Normalizar
        return Wxy.astype(int)

    def calcular_histograma(self, img):
        """Função para obter o vetor de histograma de uma imagem
        Apenas escala de cinza
        Retorna um vetor de 256 posições com o histograma da imagem
        """
        hist = np.zeros(256)
        qtdeLinhas, qtdeColunas = img.shape
        for i in range(qtdeLinhas):
            for j in range(qtdeColunas):
                hist[img[i,j]] = hist[img[i,j]] + 1
                
        return hist

    def lbp(self, img):
        """Função para obter o Local Binary Pattern (LBP)
        O algoritmo desta função não trata imagens que tenham sofrido rotação ou espelhamento
        """
        qtdeLinhas, qtdeColunas = img.shape
        img2 = np.zeros((qtdeLinhas, qtdeColunas), dtype=int)
        
        for i in range(1, qtdeLinhas-1):
            for j in range(1, qtdeColunas-1):
                A = img[i-1, j]
                B = img[i-1, j+1]
                C = img[i, j+1]
                D = img[i+1, j+1]
                E = img[i+1, j]
                F = img[i+1, j-1]
                G = img[i, j-1]
                H = img[i-1, j-1]
                
                Centro = img[i,j]
                soma = 0
                
                soma += 2**7 if A > Centro else 0
                soma += 2**6 if B > Centro else 0
                soma += 2**5 if C > Centro else 0
                soma += 2**4 if D > Centro else 0
                soma += 2**3 if E > Centro else 0
                soma += 2**2 if F > Centro else 0
                soma += 2**1 if G > Centro else 0
                soma += 2**0 if H > Centro else 0
                
                img2[i,j]  = soma    
                
        return img2

    def extrair_caracteristicas(self, img):
        """Extrai características de uma imagem retornando um histograma
        Os primeiros 256 elementos são o histograma do lbp
        Os últimos 256 elementos são o histograma do Filtro Sobel X e Y
        Retorna um histograma com total de 512 elementos
        """
        img_lbp = self.lbp(img)
        hist_lbp = self.calcular_histograma(img_lbp)
        
        img_sobel = self.filtro_sobel(img)
        hist_sobel = self.calcular_histograma(img_sobel)
        return np.append(hist_lbp, hist_sobel) #Concatenar os dois histogramas

    def entropia(self, vetor512):
        """
            Redução do numero de características do vetor de 512 para 64.
            Vetor precisa está normalizado antes da operação
        """
        new_vet = []
        cont = 1
        for i in range(0, len(vetor512), 8):
            values = vetor512[i:8*cont]
            cont += 1
            entropy = 0
            for j in values:
                if not j:
                    continue
                entropy += j * np.log2(j)
            entropy = -entropy
            new_vet.append(entropy)
        return new_vet

from sklearn.neighbors import KNeighborsClassifier
from sklearn.utils import shuffle
from sklearn.neural_network import MLPClassifier
from sklearn.tree import DecisionTreeClassifier

class CBIR():

    def __init__(self):
        self.extractor = Extractor()
        self.dict = {}
        self.dataset = []
        self.base_hists = []
        self.query = []
        self.classname = ''
        self.precision = []
        self.recall = []

        self.hists = self.read_hists()
        #self.save_entropia()

    def distancia(self, a, b):
        M = len(a)
        soma = 0
        for i in range(M):
            soma = soma + ((a[i]-b[i])**2)
        return np.sqrt(soma)

    def normalize(self, hist):
        total = np.sum(hist)
        return np.divide(hist, total)

    def read_hists(self):
        histogramas = []
        
        with open('histsentropia.db') as f:
            for line in f:
                a,b = line.split(',')
                l = a.split()
                l = map(lambda k : float(k), l)
                l = list(l)
                #histogramas[b.strip()] = histogramas.get(b.strip(), l)
                b= b.strip()
                histogramas.append((l, 'corel1000/' + b))
                #l = self.normalize(l)
                #l = self.extractor.entropia(l)
                self.base_hists.append((tuple(l), 'corel1000/' + b))

            for hist in histogramas:
                self.dict[hist[1]] = self.dict.get(hist[1], hist[0])

        return histogramas

    def save_entropia(self):
        with open('histsentropia.db', 'w') as f:
            for i in self.base_hists:
                nome = i[1].split('/')[1]
                str_carac = " ".join(str(x) for x in i[0])
                f.write("%s, %s\n" % (str_carac, nome))

    #Procurar imagem semelhante na base
    def ranking(self, nome):
        
        img = cv2.imread(nome, 0)
        hist_consulta = self.normalize(self.extractor.extrair_caracteristicas(img))
        if len(hist_consulta) > 64:
            hist_consulta = self.extractor.entropia(hist_consulta)
        
        self.query = hist_consulta
        
        d = []
        for i in self.hists:
            #hist_query = self.normalize(i[0])
            #hist_query = self.extractor.entropia(hist_query)
            #print(hist_query)
            d.append((self.distancia(hist_consulta, i[0]), i[1], i[0])) #Calcular distância entre os histogramas

        e = sorted(d)
        return e

        """
    algoritmo:após o calculo e ordenação das distancias da primeira consulta, 
    tu vai pegar e fazer bem assim, vai ter la d1,d2,d3,...,
    dn dai tu fixa d1 e d2 na lista de retorno, com isso vc vai ter um pivor 
    d2 que vai ser utilizado da seguinte forma --> se Di - pivor < pivor - d[pivor-1] 
    vc nao adiciona esse na lista, mas se for maior vc adicionna Di na lista e o pivor 
    passa a ser Di
    """
    def diversity_query(self, distancias):
        novas_distancias = [distancias[0], distancias[1]]
        pivor = distancias[1]
        index_pivor = 1
        for i in range(2,len(distancias)):
            if (distancias[i][0] - pivor[0] > pivor[0] - distancias[index_pivor-1][0]):
                novas_distancias.append(distancias[i])
                pivor =  distancias[i]
                index_pivor = i
        return novas_distancias

    def calc_precision(self, actualset):
        tp = 0
        fp = 0
        for value in actualset:
            if self.classname in value[2] and value[1] == 1:
                tp += 1
            elif self.classname not in value[2] and value[1] == 1:
                fp += 1

        print(tp, fp)
        prec = tp / (tp + fp)
        print(prec)
        self.precision.append(prec)

    def calc_recall(self, actualset, fn):
        tp = 0
        for value in actualset:
            if self.classname in value[2] and value[1] == 1:
                tp += 1
        print(tp, fn)
        recall = tp / (tp + fn)
        print(recall)
        self.recall.append(recall)

    def refilter(self, data):
        useful_data = [x for x in data if x['relevant']] # apenas os marcados como relevantes
        irrelevant = [x for x in data if x['irrelevant']]
        tantofaz = [x for x in data if x not in useful_data and x not in irrelevant]
        actualset = []
        for el in useful_data:
            a = self.dict[el['img']]
            #a = self.extractor.entropia(a)
            self.dataset.append((tuple(a), 1, el['img']))
            actualset.append((tuple(a), 1, el['img']))

        for el in irrelevant:
            b = self.dict[el['img']]
            #b = self.extractor.entropia(b)
            self.dataset.append((tuple(b), 0, el['img']))
            actualset.append((tuple(b), 1, el['img']))

        self.dataset = list(set(self.dataset))
        print(len(self.dataset))
        #self.dataset = list(set(self.dataset))
        X = list(map(lambda k: k[0], self.dataset))
        Y = list(map(lambda k: k[1], self.dataset))
        knn = DecisionTreeClassifier()
        knn.fit(X, Y)
        

        x_geral = list(map(lambda k: k[0], list(set(self.base_hists))))
        z_geral = list(map(lambda k: k[1], list(set(self.base_hists))))
        y_pred = knn.predict(x_geral)

        retorno = []

        fn = 0
        fp = 0
        tp = 0
        listnomes = list(set(list(map(lambda x : x[2], actualset))))
        #img_query = self.normalize(self.query)
        #img_query = self.extractor.entropia(img_query)
        for i in range(len(y_pred)):
            if y_pred[i] == 1:
                
                retorno.append((self.distancia(x_geral[i], self.query), z_geral[i]))
            
            if y_pred[i] == 1 and self.classname not in z_geral[i]:
                fp += 1
            elif y_pred[i] == 1 and self.classname in z_geral[i]:
                tp += 1
            
            if self.classname in z_geral[i] and z_geral[i] not in listnomes:
                print(z_geral[i])
                fn += 1

        print(len(actualset))
        self.calc_precision(actualset)
        self.calc_recall(actualset, fn)
        #self.precision.append((tp / (tp + fp)))
        #self.recall.append((tp / (tp + fn)))
        #print(retorno)

        print(self.precision, self.recall)
        retorno = list(map(lambda k: k[1], sorted(retorno)))
        return retorno