Mestrado em Informática
Data Warehouse, Data Mart, Data Mining[1]
Estudo de Caso
ÍNDICE
1. Introdução
2. Conceitos da Tecnologia.
2.1. Data Warehouse.
2.1.1. O Data Warehouse na empresa.
2.1.2. Aplicações da Tecnologia.
2.1.3. A Diferença entre dados Operacionais e Informacionais.
2.1.4. Questões críticas em Data Warehouse.
2.2 Data Marts.
2.3. Data Mining.
2.3.1. Áreas de uso do Data Mining.
2.3.2. Principais Dificuldades para uso da tecnologia.
3. Implantação da tecnologia em um Fundo de Pensão.
3.1. O Objetivo dos Fundos de Pensão.
3.2.Uma forma de controle: Qualidade dos produtos & Auditoria.
3.3. Comparativo entre os modelos OLAP e OLTP do Fundo de Pensão.
3.3.1. Questionamentos para determinação de pontos de controle.
3.4. Ficha Técnica do projeto.
3.4.1. Sistema de Informações Gerenciais - Controladoria.
3.4.2. Ambiente de Rede:
3.4.3. Técnicos:
3.4.4. Prazos:
3.4.5. Custos:
4. Conclusão
5. Referências
Data Warehouse, Data Mart, Data Mining
Resumo
As organizações precisam adotar formas de gestão eficientes para manter-se competitivas e sobreviver no ambiente onde estão inseridas. O Data Warehouse é um instrumento da tecnologia que oferece recursos para suprir as informações gerenciais necessárias para estabelecer tal controle. Os Fundos de Pensão, por sua vez, são empresas privadas com características bem peculiares, pois não há uma concorrência direta entre os fundos para captação de clientes. Contudo a sobrevivência do Plano depende dos reflexos rápidos da organização para perceber e adotar caminhos que satisfaçam as expectativas dos clientes, sem comprometer o rendimento presente que sustenta o objetivo futuro: a suplementação de benefícios sociais.
Palavras-chave
Data Warehouse, Fundos de Pensão, Avaliação Atuarial, Benefícios, Auditoria, Controladoria.
Summary
The organizations needs to adopt efficient administration forms to stay competitive and to survive in the atmosphere where they are inserted. The Data Warehouse is an instrument of the technology that offers resources to supply the necessary managerial information to establish the controller. The Pension Fund, in your time, they are companies deprived with very peculiar characteristics, because there is not a direct competition among the bottoms for customers' reception. However the survival of the Plan depends on the fast reflexes of the organization to notice and to adopt roads that satisfy the customers' expectations, without committing the present revenue that sustains the future objective: the supplement of social benefits.
Keywords
Data Warehouse, Pension Funds , Atuarial Evaluation, Benefits, Audit, Controller.
Este trabalho relata um estudo de caso, realizado em um Fundo de Pensão, com o objetivo de documentar o projeto de uma estrutura de suporte à informação gerencial até sua fase atual, ressaltando que até a presente data o projeto ainda não foi concluído: encontra-se em desenvolvimento normal, fluindo dentro do cronograma previsto.
Preocupado com os reflexos oriundos do desconhecimento dos fluxos formais, e informais, da informação relevante ao negócio "Previdência Complementar", o Fundo de Pensão recorreu à Tecnologia da Informação para a definição de um projeto piloto baseado em um armazém de dados o "Data Warehouse".
O texto não está preocupado em descrever detalhadamente os princípios da tecnologia em questão e dos métodos do Fundo de Pensão. As definições são apresentadas como instrumento de nivelamento conceitual, destinadas ao posicionamento no ambiente de estudo. O foco do é a aplicação da tecnologia de Data Warehousing para a solução de um problema específico dos Fundos de Pensão.
Observamos que a tecnologia de não é aplicada aos processos operacionais. Ela faz parte de uma instância maior dos sistemas corporativos: O controle da Informação Gerencial. Esta característica é fundamental, visto que consideramos que as transações do Processo de Concessão Benefícios em estudo são realizadas em uma 1ª camada, operacional, através de um mecanismo de banco de dados relacional, para depois serem extraídas para uma 2ª camada, gerencial, onde se situa o modelo apresentado.
O escopo da análise é, portanto, restrito as estruturas necessárias para o entendimento do processo analisado. As interfaces com outros processos, ou sistemas corporativos, foram filtradas e não são representadas no modelo de estudo. Esta simplificação visa facilitar o entendimento do objetivo do trabalho, e não interfere na compreensão do ambiente.
Por restrições impostas pela organização na qual procedemos aos estudos, nós omitiremos o nome da empresa, referenciando-a apenas como "Fundo de Pensão".
Data Warehouse ou armazém de dados contém informações obtidas de vários sistemas informáticos operacionais da empresa. Os dados são purificados por eliminação de desvios ou erros, transformados, integrados e carregados em bases de dados organizadas por assunto. Este Data Warehouse pode conter dados detalhados ou sumários históricos, abrangendo desde algumas semanas até alguns anos. Assim, um Data Warehouse pode ser definido como uma coleção de dados organizados por assunto, integrados, variantes no tempo e não voláteis, que suportam o processo decisório da gerência da empresa. As diferenças com relação às bases de dados operacionais da empresa podem ser resumidas na Tabela I:
Processamento de transações (OLTP) |
Data Warehouse (OLAP) |
|
Objetivo |
Operações do dia-a-dia |
Recuperação e análise da informação |
Estrutura |
BD relacional otimizado para processamento de transações |
BD relacional otimizado para processamento de consultas |
Modelo de Dados |
Normalizado |
Multidimensional |
Acesso |
SQL |
SQL e ferramentas avançadas de análise |
Tipo de Dado |
Dados para operar o negócio |
Dados para analisar o negócio |
Natureza do Dado |
Detalhado |
Resumido e detalhado |
Tabela I: Comparativo entre universos OLTP e OLAP.
Com a evolução da Tecnologia da Informação e o aumento do uso de computadores conectados em rede, as empresas vem buscando soluções baseadas em Sistemas de Informação automatizados para controlar seus processos mais importantes. A base desses sistemas é, em geral um banco de dados, que com o passar do tempo acaba armazenando uma grande quantidade de dados relacionados aos negócios, mas não relacionados entre si. [INMON, 99]
Estes dados controlados por Sistemas Operacionais, ou Corporativos, de uma empresa constituem um recurso, mas de modo geral, raramente servem como apoio estratégico no momento da decisão superior. Os sistemas informação "transacionais" não são projetados para gerar e armazenar as informações estratégicas, tornando-os sem valor no processo de tomada de decisões estratégicas. Com conseqüência essas decisões acabam sendo tomadas com base na experiência e conhecimento dos administradores, quando poderiam ser baseadas na análise de fatos históricos que registrados pelos diversos sistemas de informação das organizações.
Em termos simples, um Data Warehouse, ou "Armazém de Dados", pode ser definido como um banco de dados especializado, o qual integra e gerencia o fluxo de informações a partir dos bancos de dados corporativos e fontes de dados externas à empresa. Um Data Warehouse é construído para que tais dados possam ser armazenados e acessados rapidamente, em tempo real, e que não sejam limitados pela álgebra relacional dos bancos de dados. O principal objetivo do Data Warehouse é tornar as informações corporativas acessíveis para o seu entendimento, gerenciamento e uso. [INMON, 99]
Como o Data Warehouse está separado dos bancos de dados operacionais, as consultas dos usuários não causam perda de desempenho nestes sistemas, que ficam resguardados de alterações indevidas ou perdas de dados. O também não pode ser comparado a um "Sistema Operacional", que pode ser comprado e instalado em todos os computadores da empresa. Na realidade sua implantação exige a integração de vários produtos e processos.
O Data Warehouse oferece os fundamentos e os recursos necessários para um Sistema de Apoio a Decisão (SAD) eficiente, fornecendo dados integrados e históricos que servem desde a alta direção, que necessita de informações mais resumidas, até as gerências de baixo nível, onde os dados detalhados ajudam a observar aspectos mais táticos da empresa. Nele, os executivos podem obter de modo imediato respostas para perguntas que normalmente não possuem respostas em seus sistemas operacionais e, com isso, tomar decisões com base em fatos.
Com o surgimento do Data Warehouse foi necessário a quebra de alguns paradigmas dos métodos de estruturação de dados convencionais. Novas tecnologias também precisaram ser desenvolvidas, tanto para armazenamento, como para recuperação de informações. A necessidade destes novos métodos e tecnologias surgiu da constatação, primeiro de que existe uma necessidade de informação não atendida pelos aplicativos comerciais convencionais, que atuam a nível operacional do negócio, e segundo, pelo fato de que a tecnologia de armazenamento de dados utilizada nestes aplicativos não atende às necessidades detectadas. Graças aos avanços nos bancos de dados relacionais, no processamento paralelo e na tecnologia distribuída, finalmente a tecnologia da informação pode permitir que qualquer organização elabore um Data Warehouse.
Como as empresas demoram vários anos para gerar e armazenar um volume considerável de informações, é normal que esses dados estejam espalhados por diversos locais e que tenham sido gerados por sistemas desenvolvidos em diferentes ambientes e linguagens. Um dos desafios da implantação de um Data Warehouse é justamente a integração destes dados, eliminando as redundâncias e identificando informações iguais que possam estar representadas sob formatos diferentes em sistemas distintos.
Estudar e conhecer a tecnologia de Data Warehouse pode ajudar os empresários a descobrir novas formas de competir em uma economia globalizada, trazendo melhores produtos ou serviços para o mercado, mais rápido do que os concorrentes, sem aumentar o custo do produto ou do serviço. Não existem ainda metodologias formais para implementação de um Data Warehouse, ela deve ser adaptada às características e às expectativas de cada empresa, mas o principal objetivo em todas elas é o de descobrir maneiras diferentes de atuar no mercado e quais as mudanças internas que devem ocorrer para atender as novas realidades.
Autores como Inmon [INMON, 99], que é reconhecido como o pai do conceito, Data Warehouse é uma coleção de dados orientados por assuntos, integrados, variáveis com o tempo e não voláteis, para dar suporte ao processo gerencial de tomada de decisão; neste contexto, Harjinder [HAR96] conceitua o Data Warehouse como um procedimento em andamento que aglutina dados de fontes heterogêneas, incluindo dados históricos e dados externos para atender à necessidade de consultas estruturadas e ad-hoc, relatórios analíticos e de suporte a decisão. Já outro autor, Barquini [BAR, 96], define Data Warehouse como uma coleção de técnicas e tecnologias que juntas disponibilizam um enfoque pragmático e sistemático para tratar com o problema do usuário final de acessar informações que estão distribuídas em vários sistemas da organização.
As aplicações típicas do Data Warehouse em uma empresa podem ser classificadas em dois grandes conjuntos:
Aplicações do negócio: constituem as aplicações que dão suporte ao dia a dia do negócio da empresa, que garantem a operação da empresa, também chamadas de sistemas de produção.
Aplicações sobre o negócio: são as aplicações que analisam o negócio, ajudando a interpretar o que ocorreu e a decidir sobre estratégias futuras para a empresa - compreendem os sistemas de suporte à decisão e sistemas de informações executivas.
Uma arquitetura de dados adequada para dar suporte a estes dois tipos de aplicações deve estar baseada, analogamente em dois ambientes de bancos de dados: os bancos de dados operacionais - para dar suporte às aplicações do negócio; e os bancos de dados para suporte à decisão - para dar suporte às aplicações sobre o negócio.
Os Sistemas de Suporte à Decisão (SSD) e Sistemas de Informações Executivas (SIE) possuem funcionalidade e desempenho diferentes dos sistemas de produção da empresa. Estes sistemas recuperam e atualizam um registro por vez, usualmente atendendo a muitos usuários de forma concorrente, exigindo também um tempo de resposta imediato; aqueles normalmente lidam com poucos usuários por vez e os requisitos em termos de tempo de resposta podem não ser críticos. No entanto, usualmente lidam com consultas complexas, não antecipadas ou previstas, envolvendo grande quantidade de registros básicos referentes aos processos operacionais da empresa.
Os aplicativos SSD e SIE necessitam dados consistentes, normalmente originários de mais de um sistema de produção, organizados de forma que favoreçam serem trabalhados por ferramentas de análise de dados;
Bancos de dados que oferecem recursos para suporte à SSD e SIE devem ser capazes de oferecer um bom tempo de resposta para consultas que recuperam grandes conjuntos de dados agregados e históricos;
SSD e SIE usualmente lidam com tendências, e não com um único instante de tempo: cada elemento de dado é acompanhado do correspondente período de tempo a que se refere.
A importância em separar dados que dão suporte aos sistemas de caráter operacional da empresa, daqueles que dão suporte aos processos gerenciais e de suporte à decisão é que cada tipo de aplicação pode se concentrar naquilo que faz melhor, oferecendo melhor funcionalidade e desempenho para seu caso específico.
Algumas questões representam verdadeiros desafios na implantação de um Data Warehouse:
Integração de dados e metadados de várias fontes.
Qualidade dos dados: limpeza e refinamentos.
Sumarização e agregação de dados.
Sincronização das fontes com o Data Warehouse para assegurar a atualização.
Problemas de desempenho relacionados ao compartilhamento do mesmo ambiente computacional para abrigar as bases de dados corporativas operacionais e o Data Warehouse.
Data Marts são tipos especiais de Data Warehouse, contendo dados específicos para uma área ou departamento da empresa. É um subconjunto dos dados empresariais que contém dados úteis apenas para uma unidade de negócio específica ou departamento. Os dados podem ser obtidos diretamente dos sistemas informáticos operacionais ou do Data Warehouse da empresa, e as análises também são orientadas para áreas de interesse apenas daquela unidade ou departamento. Os Data Marts são muito bem aceitos no campo empresarial, pois por suas características exigem menos investimento de infra-estrutura, produzem resultados mais rapidamente e são escaláveis até um Data Warehouse.
Data Mining é o processo de analisar dados por diferentes perspectivas e resumi-los em informação aproveitável, que poderá ser utilizada melhorar os ingressos, reduzir custos ou outras ações úteis para a empresa. O software de Data Mining é um tipo de ferramenta analítica que permite analisar dados por diferentes dimensões ou ângulos, categorizá-los e resumir os relacionamentos encontrados. Tecnicamente, Data Mining é o processo de encontrar correlações ou padrões entre milhares de campos em grandes bases de dados. Informações, que aparentemente estão camufladas ou escondidas, permitindo agilidade na tomada de decisões.
Uma empresa que emprega a técnica de Data Mining é capaz de:
Criar parâmetros para entender o comportamento do consumidor;
Identificar afinidades entre as escolhas de produtos e serviços;
Prever hábitos de compras;
Analisar comportamentos habituais para se detectar fraudes.
A análise automatizada e antecipada oferecida por Data Mining, vai muito além da simples análise de eventos passados, que é fornecida pelas ferramentas de retrospectiva típicas de sistemas de apoio à decisão como consultas SQL do universo transacional (OLTP). [SANTOS & HENRIQUES & REIS, 2000]
Por esta característica o Data Mining é extremamente adequado para analisar estes grupos de dados, que seriam difíceis de serem analisados usando apenas OLAP, devido à grandeza, alta densidade ou não serem intuitivos, para serem compreendidos facilmente.
Um Data Mining pode ser considerado como sendo uma forma de descobrimento de conhecimento em banco de dados (KDD - Knowledge Discovery in Databases), área de pesquisa em evidência no momento, que envolve IA - Inteligência Artificial e Banco de Dados. A construção de modelos estatísticos costuma ser o método tradicionalmente utilizado para derivar tendências [DW,2000]. Entretanto, estatísticas tradicionais são limitadas se considerarmos que:
A análise se torna trabalhosa quando o número de variáveis a serem investigadas cresce;
Métodos estatísticos possuem condições que limitam o número de casos a utilizar, fazendo com que apenas uma pequena parte do universo esteja disponível para a análise;
Quando os relacionamentos dos dados são não lineares, torna-se difícil aplicar métodos estatísticos tradicionais.
Além disso, poucas empresas dispõem de pessoal preparado para esta tarefa tão especializada, mesmo com a ajuda de estatísticos, pode-se levar semanas para projetar e construir os modelos.
A estrutura de um Data Mining está baseada em Estatística, Inteligência Artificial e em Machine Learning, conforme apresentado na Figura 1.
Figura 1: Base de um Data Mining [DW, 2000]
A ferramentas de Data Mining, podem trabalhar em cima de qualquer grupamento estruturado de dados, não precisando necessariamente ser um banco de dados formal. Isto elimina a obrigatoriedade de aplicar estas ferramentas em Data Warehouses. Deve-se porém ressaltar que, se queremos ter maior êxito na busca de relacionamentos nestes dados ou ainda transformá-lo em base para tomada de decisão, o mais indicado é ter estas ferramentas "trabalhando dentro" de dados bem organizados e abrangentes, que é um dos objetivos ao criarmos Data Warehouses ou Data Marts.
As três grandes áreas de uso de um Data Mining, de modo simplificado, são:
Cross-selling Identificar associação entre produtos, procurando tirar proveito dessas associações. "Descobriu-se em uma determinada cadeia de lojas que ao comprar um brinquedo, geralmente era levado barras de chocolate";
Up-selling Identificar entre os clientes atuais aqueles que tem potencial para adquirir produtos que proporcionem maior lucro para a companhia. "Através da definição de um perfil de usuário, que compra um produto, podemos determinar que outros usuários, de mesmo perfil e, que ainda não tem este produto, venham a comprá-lo";
Fidelização: Combinar e descobrir fatores que causem a perda de clientes, e como forma economia, manter estes clientes, o que é mais barato que conquistar novos.
O Data Mining faz uso da simulação, que representa a ação de construir um modelo, ou cenário, de uma situação onde se sabe a resposta e aplicá-lo a outra situação onde a resposta é desconhecida. Aplicando-se técnicas para executar a simulação é possível achar padrões relevantes e de interesse do usuário. As técnicas e os algoritmos mais utilizados pelo Data Mining para análise da informações são representadas por: [DW, 2000] e [THEARLING, 2000]
Decision Trees
Rule Induction
Neural Networks
Market Basket Analysis
Genetic Algorithms
Memory-Based Reasoning (MBR)
Existem alguns empecilhos para o uso de Data Mining, o mais significativo hoje ainda é o alto custo, porém vários fatores podem impedir sua implantação:
Organização
Alto Custo
Necessidade Grandes Bases de Dados
Novidade e Complexidade
Montar Ambientes Ideais
Os sistemas de Previdência Social oficiais em geral não têm condições de garantir a qualidade de vida dos trabalhadores quando estes se aposentam. Isso porque em geral são baseados no regime de repartição simples, ocorrendo o custeio por uma geração dos benefícios concedidos à geração antecessora [ABRAPP, 00].
Diversos países evoluídos como Estados Unidos, Alemanha e Japão, adotaram modelos complementares privados, baseados na poupança de longo prazo para o financiamento de uma renda futura, complementar àquela oriunda da Previdência Pública. O modelo privado é mais ágil, baseado na capitalização, e os participantes formam as reservas durante seu período ativo, o que garantirá benefícios futuros e disponibilidade de recursos no momento da aposentadoria [ALLEN, 95].
No Brasil a Lei 6.435/77 rege o funcionamento da previdência complementar. Por este instrumento legal são estabelecidos dois tipos de plano: o aberto, operado por seguradoras e permitida a associação de qualquer cidadão, e o fechado, operado por um Fundo de Pensão e restrito a uma comunidade específica [ALLEN, 95].
As diferenças entre os dois modelos são marcantes. No sistema aberto o investidor é o único garantidor da sua poupança. Há o depósito mensal na reserva financeira, que, acrescida do rendimento contratual, irá compor o montante de custeio do pagamento da aposentadoria, vitalícia ou não. No modelo fechado as entidades não visam a distribuição de lucros e prevêem a contribuição de duas fontes: do participante e da empresa na qual ele mantém vínculo empregatício, em geral com a relação de 1:1, para compor a reserva de poupança individual do trabalhador.
As Entidades Fechadas de Previdência Privada (EFPP) operam o Fundo de Pensão instituído pelas suas Patrocinadoras - Empresas associadas que detêm o vínculo empregatício dos Participantes, ofertando planos de benefícios complementares aos oferecidos pela Previdência Social na forma de renda ou pecúlio. Estes recursos suplementam o montante pago pela Previdência Social, através do Instituto Nacional do Seguro Social - INSS, fazendo com que a renda ou pecúlio atinja o mesmo nível salarial do participante, preservando-o, ou a seus dependentes, de oscilações bruscas de renda.
As entidades que administram os Fundos de Pensão sofrem constantes auditorias face à natureza social do seu negócio e aos elevados montantes financeiros manipulados. O governo, regulador dos planos através da Secretaria de Previdência Complementar, as patrocinadoras e os próprios participantes exigem a transparência operacional, e analisam de forma contínua o desempenho das entidades. Em resumo, todos os planos (produtos e serviços ofertados) são regidos por Leis específicas que estabelecem limites de investimento, mínimos de lucratividade e níveis de comprometimento com os compromissos futuros.
A lógica estabelecida para o controle dos fundos é simples: como captação, as entidades utilizam as contribuições dos participantes e patrocinadoras e a operam nos mercados financeiro e imobiliário. Algumas entidades também oferecem o crédito mútuo com taxas diferenciadas do mercado financeiro público ou até mesmo financiam imóveis para os participantes. Contudo deve haver previsão em caixa para o pagamento dos benefícios compromissados, sejam aqueles que podem ser previstos, tais como: aposentadoria por tempo de serviço ou aposentaria por idade, ou aqueles de risco, que ocorrem aleatoriamente, como: pensão, auxílio-doença ou aposentadoria por invalidez [ALLEN, 95].
O "caixa" destas entidades, chamado de "Reserva Matemática", é calculado conforme as características do grupo de pessoas que compõem Planos, assumindo que podem existir grupos independentes, com características próprias, dentro da mesma entidade - é o caso dos fundos multipatrocinados. O montante acumulado individualmente para cada participante é denominado Reserva de Poupança, e representa o valor do investimento que servirá de lastro para o pagamento dos benefícios futuros deste participante.
Observemos, em tempo, que as características do grupo, termo citado anteriormente, refere-se a média de idade, expectativa de vida, média de rendimentos, número médio de dependentes, e outros aspectos relevantes para a "Avaliação Atuarial", um cálculo estatístico baseado em tabelas-padrão aprovadas pelo Governo Federal específicas para este fim. Os métodos para o cálculo dos compromissos futuros da entidade são de responsabilidade da Atuária, ciência que abrange técnicas da matemática financeira, cálculo de probabilidade e estatística.
Através da "Avaliação Atuarial" os administradores terão condições de estabelecer quanto dinheiro deve estar disponível em determinada data, sendo este suficiente para cobrir os compromissos previstos e os de risco. Não pode faltar dinheiro - o que ocasiona um déficit técnico ou sobrar dinheiro o que causaria um superávit técnico. As duas situações são ruins: a primeira porque caracteriza a falta de recursos de um grupo para cobrir seus benefícios, forçando o fundo a buscar recursos em outros lugares; no segundo caso o dinheiro ficou parado na Tesouraria, sem a lucratividade mínima, resultando em prejuízo.
A forma de o atuário prever o montante de caixa é a construção de cenários que levam em consideração variáveis que se alteram dinamicamente no tempo, como os compromissos assumidos pelos participantes e patrocinadoras, a política econômica adotada, as experiências estatísticas na previsão de riscos, a rotatividade dos empregados nas patrocinadoras, os níveis e planos salariais adotados pelas empresas entre outros fatores.
Para que o Gestor de um Fundo de Pensão tenha apoio gerencial sobre suas decisões, deve haver um perfeito sincronismo entre os compromissos futuros, estabelecidos pela Avaliação Atuarial, com os níveis de investimentos realizados no Mercado de Capitais, carteira de empréstimos e financiamentos, e finalmente, com a captação das contribuições de participantes e patrocinadoras [ALLEN, 95]. Este equilíbrio entre os Ativos e Passivos do Fundo de Pensão podem ser mapeados e analisados através das técnicas de "Data Warehousing".
Outro aspecto relevante para o acompanhamento do desempenho do Fundo de Pensão é o estabelecimento de Pontos de Controle, ou INDICADORES DE DESEMPENHO. Estes fatores são críticos, pois estão diretamente correlacionados com os PRODUTOS oferecidos pelo fundo. Neste aspecto as técnicas de "Data Mining" constituem uma importante ferramenta para o diagnóstico de cenários futuros.
A Avaliação Atuarial é imprescindível para o controle de um Fundo de Pensão, e dentre os processos internos que mais afetam o comportamento do estudo atuarial situa-se a Concessão de Benefícios. Este processo específico tem importância relevante para o desempenho do fundo, visto que é a "atividade fim" da empresa. O controle de qualidade na concessão dos benefícios está diretamente associado com a imagem de segurança que a empresa reflete para seus participantes e auditores.
Selecionamos um pequeno cenário para comentar a implantação do projeto piloto: na Figura 2 apresentamos uma instância do Modelo de Dados do Fundo de Pensão, no qual aparecem os principais objetos utilizados pelo processo de concessão. Comentamos que, conforme apresentado na introdução deste trabalho, essa instância do modelo de dados não representa a totalidade dos negócios do Fundo de Pensão. Nele estão representados os detalhes necessários para o entendimento da origem dos dados que irão compor a informação gerencial.
Nota-se que não faz diferença para o Data Warehouse qual o front-end utilizado para o desenvolvimento dos aplicativos corporativos. O universo dos dados é tratado como fonte de informações, sendo os programas extratores responsáveis por busca-las nas bases relacionais do banco de dados corporativo. Também é responsabilidade destes programas o teste de integridade para compor as informações classificadas como métricas e, conseqüentemente, as dimensões.
Figura 2 - Modelo de Entidade e Relacionamentos - Segmento do Modelo da Organização que representa a "Concessão de Benefícios."
O primeiro passo para a definição do modelo multidimensional é o estabelecimento das métricas, para compor a tabela base. Estas métricas são analisadas nos questionamentos relacionados a seguir, e irão compor o modelo multidimensional apresentado na Figura 3.
Quem pode requerer benefícios no mês "X"?
Objetiva identificar quem pode requerer aposentadoria por idade ou tempo de serviço no mês "X". Com esta informação a entidade pode iniciar trabalhos de assistência social no período de mudança na situação laboral do participante.
Quantas pessoas poderiam requerer benefício no mês "X" e não o fizeram?
A previsão orçamentária para o mês "X" e posteriores cobrem a concessão do benefício, que se não for solicitado acaba por gerar excedente de caixa, desequilibrando o plano.
Dos benefícios concedidos no mês "X", quais são as espécies?
São dados estatísticos, úteis para a elaboração de cenários e auditoria, no caso de variações fora do padrão dos grupos de participantes.
Qual a média dos benefícios concedidos nos últimos "X" meses?
Também são dados estatísticos, para comparação com o item anterior.
Existe algum participante com mais de um benefício ativo?
Esta informação é de auditoria. Esta situação não pode ocorrer.
Qual o montante dos benefícios concedidos no mês "X"?
Esta informação é importante para o verificar o comprometimento da reserva matemática no mês "X".
Gráfico comparativo da Reserva Matemática e Benefícios Concedidos por grupo no ano.
Esta é uma maneira gráfica para analisar informações já obtidas em consultas anteriores, referentes ao montante dos benefícios pela reserva matemática durante os meses. Este gráfico funciona como um "fluxo de caixa", indicando períodos de déficit ou superávit.
O modelo OLAP apresentado na Figura 3 é alimentado com as informações do modelo OLTP da Figura 2, necessárias para a resposta aos questionamentos padronizados (1 a 7) descritos anteriormente.
Figura 3 - Modelo Multidimensional (OLAP) "Star Schema" - Trecho "Concessão de Benefícios".
Não existe interação a nível operacional no Data Warehouse, as aplicações corporativas acessam a base OLTP e neste ambiente - a primeira camada - realizam as transações de rotina. Um conjunto de rotinas específicas acessam o banco OLTP periodicamente, sendo responsável pela carga das tabelas do Data Warehouse - a segunda camada.
Neste momento os dados ficam redundantes, na base OLAP e OLTP. Por este motivo qualquer operação de "insert" ou "update" na base OLAP é proibida: se acontecer alteração dos dados OLAP a mesma operação terá que ser feita na base OLTP, senão haverá quebra de integridade.
Notamos que a integridade é mantida pelas rotinas de carga do Data Warehouse, as únicas que podem alterar ou inserir informações na base OLAP. Estas rotinas extraem as informações relevantes para a composição das métricas e das dimensões do Data Warehouse, e as disponibilizam de forma íntegra para a consulta.
Dessa forma concluímos que a operação do Data Warehouse é semelhante à de um grande extrator de informações, tabuladas conforme as dimensões, ou "fatias" (slices) projetados [KIMBALL,98].
Observamos que no exemplo os questionamentos são padronizados, contudo, conforme a característica dos Data Warehouse, qualquer consulta pode ser construída através do modelo, com garantia de desempenho e integridade dos resultados. Este tipo de questionamento, denominado "ad-hoc" é suficiente para destruir uma base OLTP, mas é um ponto forte da base OLAP [KIMBALL,98].
Observamos que os recursos tecnológicos foram alocados para o projeto de uma Controladoria, base tecnológica para o funcionamento de uma Gestão de controle da Informação Gerencial. Como o modelo analisado é apenas um braço desta gestão, os recursos são compartilhados com outros projetos, fora do âmbito deste trabalho, mas todos baseados na tecnologia de Data Warehouse.
A Controladoria deve ser um setor do organização capacitado a organizar e reportar dados e informações relevantes e influir nas decisões dos gestores da entidade. Na moderna concepção de controladoria, os resultados obtidos extrapolam o mapeamento contábil convencional, devendo agregar valores novos, obtidos através da análise dos indicadores de desempenho que mapearam o negócio da organização, atuando como contabilidade gerencial.
O resultado do Sistema de Informação Gerencial, fundamentado na contabilidade gerencial, deve ser capaz de oferecer aos gestores insumos para a definição das melhores alternativas de ação para o alcance dos objetivos. O conhecimento adquirido permite a mensuração dos resultados e identificação imediata de falhas no planejamento, possibilitando a sugestão de ações mais rápidas e eficazes para correção das tendências empresariais.
A proposta do projeto-piloto descrito neste documento é construir a infra-estrutura organizacional para suportar essa agilidade gerencial, com as características relacionadas a seguir:
Módulo Extração e Transformação:
Obtém e verifica a integridade dos dados do sistema OLTP.
Transfere os dados elaborados para a base OLAP.
Módulo Contabilidade:
Responsável pelo registro dos indicadores de desempenho.
Serve como base para os demais módulo na certificação das informações gerenciais.
Módulo Orçamento:
Interface para simulação de cenários para os planos de ações gerenciais.
Expõem tendências e cenários, através do fornecimento de resultados e comparativos de desempenho.
Módulo Avaliação de Resultados:
Avalia os resultados e desempenhos individuais e consolidados dos serviços e gestores.
Subsidiam a decisão sobre manutenção, desativação ou implementação de unidades, produtos e serviços.
Módulo de Informações Gerenciais:
Gestor de metadados sobre a organização.
Fornecimento de conhecimento para elaboração cenários.
Rede local baseada em servidores Windows NT, versão 4.0-SP5. Um destes servidores é dedicado exclusivamente para hospedar o Banco de Dados Transacional (OLTP) e outro suporta a Base Analítica (OLAP). Em ambos servidores estão instalados o gerenciador de Banco de dados SQL Server, versão 7.0 da Microsoft. No servidor OLAP também funciona o OLAP Manager e o DTS (Data Transformation Services), instrumentos para controle e extração de dados. As máquinas utilizadas como servidores são baseadas na arquitetura Intel Pentium III de 700Mhz, com 256 Mbytes de memória RAM e aproximadamente 100 Gbytes disponíveis em disco rígido
Existem 6 estações de trabalho baseadas no ambiente Windows 95/98, inseridas no domínio da rede local da instalação, nas quais estão instalados os clientes necessários para a definição e operação das consultas ao DW. Estas estações são máquinas baseadas em processadores Intel Pentium de 200 MHz com 64 Mbytes de memória RAM, alocadas para os técnicos responsáveis pelo Projeto Piloto. O ambiente "Data Warehouse " ainda não está disponível para produção.
A equipe é composta por 5 Analistas de Sistemas e 1 Programador. 1 Analista atua como Gerente de Projetos, responsável pela interface com a direção ("Board") e outros 2 atuam com Coordenadores de Metas (Projetistas). Todos atuam em todos os projetos que envolvem o uso da tecnologia de Data Warehouse.
Todos os Analistas possuem formação superior, 3 em Informática. 3 são pós-graduados em áreas correlatas, 1 é Especialista em Gestão da Informação. Todos estão sendo treinados no uso das ferramentas de software utilizadas.
Existe um cronograma de 4 anos estabelecido pelo Plano Estratégico da empresa a ser cumprido. Dentro deste cronograma aparece o projeto específico detalhado neste estudo de caso, com prazo de 12 meses para a implantação, dividido em duas fases:
1ª Fase: Implementação da estrutura lógica (definição dos indicadores de performance).
2ª Fase: Desenvolvimento do Sistema de Informações da Controladoria e utilização do método Data Warehouse.
A planilha de custos orça a quantia inicial de R$100.000,00 envolvendo os itens:
Compra de 1 servidor de banco de dados: R$ 25.000,00
Treinamento: R$20.000,00
Viagens e participação de congressos: R$5.000,00
Aquisição de licenças de software: R$20.000,00
Reserva técnica / Gastos com outros projetos: R$30.000,00
Quando a questão é a sobrevivência no mercado, as organizações buscam alternativas para manter seu diferenciador. Constatamos que em ambientes diversos, seja altamente competitivo como no Mercado Financeiro, ou não como no Mercado dos Fundos de Pensão Privados, há sempre um fator que motiva os gestores a procurar o melhor desempenho das suas organizações.
A maior curiosidade é que um fundo de pensão privado não precisa, a rigor, captar clientes, eles vêm direcionados pelo diferenciador do setor de Recursos Humanos de uma segunda empresa, a Patrocinadora. Aparentemente a "não concorrência" pode causar o acomodamento dos gestores dos fundos, pois o fluxo de clientes ocorre naturalmente, mas, na realidade, não é isso que acontece. Os fundos estão cada vez mais competitivos, justificando seus custos operacionais com serviços cada vez melhores.
Os esforços, no sentido de aumentar a eficiência dos planos, movimentam toda a estrutura dos fundos, envolvendo novos projetos e novos paradigmas de controle. Assim aparece a tecnologia do Data Warehouse, que comporta a base de conhecimentos necessária para suporte à decisão estratégica das organizações.
Constatamos que a adoção da tecnologia é um investimento alto, que consome dinheiro, tempo e muito intelecto daqueles que o implementam. Notamos, que neste nicho de mercado não ocorre a falta de verba, mas as decisões são tomadas com muita cautela, visto que o nível de auditoria é muito alto. Assim a implementação de projetos de porte são orientadas por etapas pequenas, que podem projetar o sucesso ou o fracasso do empreendimento. Os passos dados são pequenos, e sempre há a preocupação com o retorno dos investimentos realizados.
Neste contexto, a maior dificuldade encontrada pelo projeto é a justificativa para a realização de despesas com a inovação tecnológica. É facultado o acesso do técnicos à formação, contudo as verbas com este fim são muito questionadas e comparadas com prioridades imediatas da empresa. É um paradoxo curioso, pois os gestores estão cientes da necessidade de melhorar o desempenho, mas não rompem a ligação com "investimento", numa analogia ao investir dinheiro e realizar lucros no Mercado de Capitais.
Outro aspecto de relevância, que vem sendo notado durante a execução do projeto, é a referência ao autoconhecimento empresarial, ou a quebra de paradigmas empresariais. Mesmo sem a operação do Data Warehouse é comum gerentes perceberem erros e falhas operacionais antes não detectados, pelo simples fato de repensar o negócio.
A adoção da tecnologia foi um grande salto para a organização, que ainda está insegura na sua adoção, mas confia, e espera, bons resultados dentro do período de quatro anos previsto para o projeto piloto.
[ABRAPP, 00] - ABRAPP - "Associação Brasileira das Entidades Fechadas de Previdência Privada", através do site https://www.abrapp.org.br , consultado durante os meses de maio e junho de 2000.
[ALLEN, 95] - ALLEN, EVERET T. - "Planos de Aposentadoria" - Instituto Cultural de Seguridade Social, ICSS / Consultor, 1995.
[BAR,
96] BARQUINI,
RAMON - Planning and designing the Warehouse,
[DW, 2000] DW, Equipe - "Data Warehouse - Data Mining", https://www.datawarehouse.inf.br/ , artigo: "Uma breve história do Data Mining", visita em 20/03/2000.
[HAR, 96] HARJINDER, G. e RAO, P. C. - The Official Guide to Data Warehousing, Que Corporation, 1996.
[INMON, 99] - INMON, W.H. - "Gerenciando Data Warehouse" - Makron Books, 1999.
[KIMBALL, 98] - KIMBALL, RALPH - "Data Warehouse Toolkit" - Makron Books, 1998.
[SANTOS & HENRIQUES & REIS, 2000] SANTOS , José, HENRIQUES, Nuno A.C, REIS, Vanda , "Data Mining / Data Warehousing" - FCT, Janeiro de 1999, https://students.fct.unl.pt/users/nach/dmdw/prologo , consulta em 01/04/2000.
[THEARLING, 2000] THEARLING, Kurt - "Data Mining, CRM, Decision Support, and Database Marketing (Kurt Thearling)", https://www3.shore.net/~kht/text/dmwhite/dmwhite.htm , consulta em 29/03/2000.
|