DEV Community

Roberto Vinicius da silva
Roberto Vinicius da silva

Posted on

Análise e Precificação do Café

Image description

Este artigo tem como objetivo gerar uma análise exploratória para entender o público, utilização de técnicas de associação de variáveis para extrair insights com Information Values (IV) e utilizar a teoria frequentista para atribuir a probabilidade do café ser premium

Entendimento do negócio

O banco AgroTech Bank é especializado no Agronegócio e deseja trazer mais eficiência no processo de precificação das garantias oferecidas pelos clientes ao solicitar crédito.

Uma garantia é um bem que o cliente coloca como garantidor do empréstimo solicitado. Se o cliente não arcar com os pagamentos em dia o banco tem o direito de “executar as garantias”, ou seja, de pegar o bem fornecido como garantia e tentar vender no mercado para cobrir o saldo devedor deixado pelo cliente inadimplente.

As garantias oferecidas pelos clientes são diversas: Desde valores mobiliários (ações de empresas) até alimentos perecíveis como carnes congeladas ou peixes. Um tipo de garantia em especial muito utilizada pelos clientes da AgroTech Bank é o Café. Muitos clientes solicitam empréstimos de capital de giro com garantia de sacas de café já produzidas.

O problema disso é que o AgroTech Bank não dispõe de uma ferramenta eficiente para a devida precificação das sacas de café. Os problemas que isso têm trazido para a operação são garantias que não valem tanto quanto a área de Garantias tinha estimado no momento do empréstimo. Desta forma, quando o banco tenta vender o café no mercado, muitas vezes o valor de venda não quita o saldo devedor.

O problema disso é que o AgroTech Bank não dispõe de uma ferramenta eficiente para a devida precificação das sacas de café. Os problemas que isso têm trazido para a operação são garantias que não valem tanto quanto a área de Garantias tinha estimado no momento do empréstimo. Desta forma, quando o banco tenta vender o café no mercado, muitas vezes o valor de venda não quita o saldo devedor.

Para resolver isso, o banco pediu para a área de Analytics uma Calculadora de Garantias para Sacas de Café. Para construir esse “Data Product” (Produto de Dados), a área de Garantias forneceu uma base com 862 tipos de cafés produzidos mundialmente com 4 caraterísticas que são importantes para definir se o café é Premium (mais caro) ou do tipo Normal (mais barato).

A calculadora esperada pela área segue abaixo:

Image description

Com base nessas informações, pede-se:
1) Quais as características do café aumentam a propensão dele ser do tipo Premium?

2) Para construir a calculadora solicitada conforme exemplo acima. A ideia é que o usuário informe as 5 primeiras informações (de País de Origem até a qte de Sacas de 60kg) e a calculadora possa fornecer as duas informações (Valor Aproximado da Garantia e Valor máximo a ser liberado para empréstimo).

Base de dados

A base disponibilizada já está com os dados devidamente tratados, dessa forma não será necessário realizar o processo de ETL (Extract, Transform e Load).

A base esta dividida em dois grupos de variáveis :

  • Quantitativa: são aquelas que podem ser mediadas em números, como idade altura, peso, renda, etc.

Image description

  • Qualitativa: são aquelas que expressam características ou atributos, com cor, gênero, nacionalidade, profissão, etc.

Image description

Análise do Information Value (IV)

O Information Value (IV) é uma métrica que quantifica a capacidade de uma variável preditora em diferenciar entre duas classes, geralmente em um contexto binário (por exemplo, “Sim” e “Não”). O IV é especialmente útil em modelos de previsão. Como a maioria das variáveis são qualitativas optei por essa técnica para análise dos dados.

Image description
Realizando as análises com Information Value (IV) das variáveis identificamos que os países e tipo de variedade tem um forte índice de predição para a variável café premium

Image description

Insights

  • A variável país é um forte preditor da variável ‘café premium’;
  • Podemos segmentar o mercado com base no país, já que essa variável é altamente informativa sobre quem produz café premium;
  • A variável do tipo variedade também apresenta uma forte predição de café premium;
  • Podemos pressupor que o tipo de variedade para fabricação do café premium pode ter uma correlação com o país, ou seja, algumas variedades podem ter correlação com a fabricação desse tipo de café;

Respondendo a pergunta que foi levantada no inicio do artigo pela área de negócio, segue as respostas:

01 — Quais as características do café aumentam a propensão dele ser do tipo Premium?

Conforme classificação do Information Value, as características que podem aumentar a propensão de se ter café do tipo premium são: Países, Tipo de variedade e faixa de altitude

2) Para construir a calculadora solicitada conforme exemplo acima. A ideia é que o usuário informe as 5 primeiras informações (de País de Origem até a qte de Sacas de 60kg) e a calculadora possa fornecer as duas informações (Valor Aproximado da Garantia e Valor máximo a ser liberado para empréstimo).

A calculadora está disponível no Excel que foi disponibilizado pela área de negócios no GitHub com as devidas alterações

Para ter acesso ao repositório com base de dados e análises realizadas, clique aqui!

Top comments (0)