Como a visão computacional está no centro da inteligência da Omnidata
A aquisição da CrowdVision é fundamental para a metodologia de inteligência omnidata da Beonic. Em termos simples, a inteligência omnidata incorpora todos os elementos necessários para fornecer uma solução de dados bem-sucedida. Analisar dados para obter uma melhor compreensão de algo não é normalmente tão simples como a fonte de dados X é utilizada para compreender Y.
A inteligência omnidata adopta uma visão mais ampla e considera estas questões: Qual é a combinação correta de fontes de dados necessária para resolver um determinado problema? Quem são os intervenientes certos para definir esse problema, conceber uma solução e avaliar o resultado? E que tecnologias e métodos de análise são necessários para obter um resultado bem sucedido?
O domínio científico da visão por computador é uma área em que uma abordagem de inteligência omnidata é bem adequada. A CrowdVision possui uma vasta experiência e capacidades neste domínio, o que faz da CrowdVision um complemento perfeito para a Skyfii e para a nossa metodologia de inteligência omnidata.
Então, o que é exatamente a visão por computador e como é que complementa os produtos e serviços existentes da Beonic? Comecemos pelo conceito de visão por computador. A visão por computador é essencialmente um termo que descreve a forma como os computadores aplicam métodos de Inteligência Artificial (IA) para interpretar o conteúdo da imagem. O conteúdo da imagem pode incluir dados de fluxo de vídeo de uma câmara CCTV ou pontos de dados de imagem 3D captados através de um sensor ótico LiDAR.
Uma variedade de opções é crucial na escolha da melhor tecnologia ou conjunto de tecnologias a utilizar para um caso específico de utilização de análise de dados. A solução CrowdVision utiliza várias tecnologias de visão por computador para permitir uma solução mais adequada para os clientes. Este é um ponto extremamente importante quando se considera que a escolha da ferramenta certa para o trabalho é frequentemente o fator determinante para o êxito de um projeto.
Vamos agora explorar duas tecnologias de visão computacional proeminentes que são suportadas pela solução CrowdVision.
Vídeo
Os dados de vídeo provenientes da tecnologia de câmaras, como 2D, 3D e CCTV, podem permitir aos operadores de recintos de eventos compreender o comportamento e o movimento de objectos num espaço. Para tal, a IA é aplicada aos dados de vídeo para classificar os objectos (por exemplo, pessoa, carro, bicicleta) observados no campo de visão da câmara. Em seguida, o comportamento destes objectos é medido para compreender a permanência, o percurso, a direção, o fluxo, a contagem, etc.
Esta classificação e medição comportamental permite uma série de casos de utilização valiosos, incluindo o acompanhamento do pessoal, a gestão de filas, a gestão de incidentes, a deteção demográfica, a gestão da ocupação, a monitorização da distância social, a automatização de parques de estacionamento e o controlo de acesso inteligente.
LiDAR
Os dispositivos de deteção e telemetria de luz (LiDAR) transmitem sinais laser e interpretam o tempo de reflexão à medida que esses sinais são reflectidos nos objectos num espaço 3D. O processo de medição dos tempos de reflexão mapeia a posição e o movimento dos objectos. Tal como as câmaras, os sensores LiDAR são normalmente fixados no teto ou nas paredes de um edifício para garantir o melhor campo de visão. E, tal como as câmaras, os sensores LiDAR classificam e medem o comportamento dos objectos dentro do seu campo de visão.
Por conseguinte, o LiDAR permite casos de utilização semelhantes aos do vídeo. A diferença entre as duas tecnologias reside geralmente na identificação ou categorização de um objeto. Por exemplo, a classificação do objeto "veículo" pode ter as categorias "uber", "lyft" e "público". A visão por computador baseada em vídeo pode detetar a presença de um determinado logótipo na janela de um veículo para o categorizar, enquanto a visão por computador baseada em LiDAR utilizaria provavelmente o comportamento de um veículo para o categorizar.
Como escolher a melhor tecnologia de visão computacional para o seu local
Estas variações nas tecnologias são, de facto, a forma como cada uma possui as suas vantagens únicas. Por exemplo, em ambientes onde é importante aumentar a privacidade ou a sensibilidade dos dados, a incapacidade do LiDAR para identificar um indivíduo pode ser uma solução mais adequada. O vídeo, por outro lado, pode ser mais adequado para casos de utilização que exijam a identificação de um objeto, como a identificação da matrícula de um veículo.
A visão computacional fornece uma forma de os ambientes físicos automatizarem processos que são demasiado lentos, complexos ou dispendiosos para serem executados manualmente. A capacidade de escolher a tecnologia de visão computacional mais apropriada para um determinado ambiente é essencial para um resultado bem-sucedido e, portanto, essencial para a metodologia de inteligência da omnidata. Se desejar assistência para escolher a melhor solução tecnológica para seu local, estamos aqui para ajudar.