이벤트 처리는 온라인 구매, 주가의 상승 및 하락, 사용자가 웹 사이트에 남아있는 시간 또는 환자의 방에 들어가기 전에 손을 씻는 시간과 같은 수신 정보 슬롯 머신림을 추적하고 분석하는 방법입니다. 들어오는 데이터에서 중요한 이벤트를 표시하는 것이므로 조직은 실시간으로 응답 할 수 있습니다. SETA는 복잡한 쿼리 및 분석을 처리 할 수 있으며, 사용자에게 현재 가능한 것보다 더 저렴하고 빠르게 통찰력을 제공합니다.
대부분의 기존 데이터 분석 도구는 슬롯 머신리밍 데이터와 함께 작동하도록 설계되지 않았다고 Rundensteiner는 지적했다. 대신, 정보를 분석하기 전에 정적 데이터베이스에 저장되어야하며, 예를 들어 병원에서 감염성 질병 발생이 시작되는 것과 같은 빠른 탐지를 방해 할 수있는 지연을 도입해야합니다. Rundensteiner의 도구는 생성 될 때 데이터에서 작동하므로 복잡한 패턴을 실시간으로 발견 할 수 있으므로 중요한 결정을 신속하게 결정할 수 있습니다.
“데이터 슬롯 머신림은 극적인 속도로 증가하고 있으며, 실시간으로 데이터를 이해할 수없는 압도적 인 비즈니스”라고 Rundensteiner는 말했습니다. “이러한 라이브 슬롯 머신림을 처리 할 수있는 방법을 찾아서 우리는 데이터 분석에서 새로운 지평을 열고 있습니다.이 모든 빅 데이터를 정적 데이터베이스에 고정시켜 나중에 볼 수 있지만, 사기 신용 카드 구매가 발생함에 따라 사기 신용 카드 구매를 포착하려면 앞으로 사고에 대해 자율적 인 자동차 네트워크를 경고 할 때 해당 정보를 수십 마리의 데이터에 대해 슬롯 머신리밍 할 때 해당 정보를 분석해야합니다.
새로운 상을 통해 Rundensteiner는 슬롯 머신리밍 데이터에서 패턴을 찾는 데 중점을 둔 이벤트 슬롯 머신림 분석에서 이전 NSF 후원 연구를 기반으로 할 것입니다. 이 작업 (전 박사 과정 학생들과 협력하여 Microsoft Grey Systems Lab의 연구 과학자 인 Olga Poppe, IBM Almaden Research Center의 연구 직원 인 Chuan Lei 및 Facebook의 연구 과학자 인 Di Wang)은 비교적 간단한 이벤트 시퀀스를 위해 데이터 슬롯 머신림을 쿼리 할 수있는 분석 도구를 제작했습니다. 그러나 소프트웨어가 동일하거나 유사한 시퀀스의 많은 인스턴스를 발견하고 모두 표시하면 사용자는 종종 압도 당하고 패턴에 걸친 중요한 패턴이나 전반적인 트렌드를 놓칠 것입니다.
감지 된 시퀀스를 하나씩 표시하지 않고 새로운 도구 RundenSteiner는 이러한 패턴을 집계하고 사용자에게 각각 몇 번이나 발생하는지 보여줍니다. 그녀는“비정상적인 활동의 급등을 보여줌으로써 시스템을 통해 무슨 일이 일어나고 있는지 매우 빨리 볼 수 있습니다.”라고 그녀는 말했습니다. “때때로 나는 비정상적인 패턴의 편차에 더 관심이 있습니다. 왜냐하면 나는 비정상적인 일이 일어나고 있는지 즉시 알고 있기 때문에 즉시 알고 있습니다. 하나의 자율 주행 자동차가 휩쓸고 있다면 아무 의미가 없을 수도 있습니다. 그러나 같은 도로에있는 수천 대의 차가 행동을 일으키는 행동을 전시 할 수 있습니다. 그러면 특정 데이터의 하위 집합에 더 깊이 파고들 수 있습니다.
이러한 패턴 집계를 더 깊이 파는 도구 개발은 SETA에 대한 연구의 또 다른 요소입니다. Rundensteiner는 사용자가 훨씬 더 정교한 패턴을 찾도록 권한을 부여하려고합니다. 예를 들어, 그녀의 이전 도구는 고정 된 길이의 시퀀스 (예 : 브레이크를 활성화하고, 멈추고, 멈추는 차량의 인스턴스)를 찾는 데 사용될 수 있지만, 단일 간단한 슬롯 머신림 쿼리를 사용하여 불완전한 수의 인스턴스를 발견하고 반복적으로 숫자를 두드리는 차량을 발견하고 정지를 위해 오는 차량을 발견 할 수 있도록하기를 원합니다. 쿼리 언어의 복잡성으로 인해 이러한 쿼리와의 잠재적 일치의 수가 기하 급수적으로 증가 할 수 있지만 결과는 더 유용하다고 약속합니다.
새로운 이벤트 트렌드 분석 도구를 만들려면 rundensteiner는 먼저 데이터의 패턴을 찾고 검색하는 데 사용되는 새로운 쿼리 언어를 설계해야합니다. 사용자가보다 복잡한 패턴을 검색 할 수있게함으로써 새로운 언어를 사용하면 도구를 훨씬 쉽게 사용할 수 있습니다. 또한 이러한 정교한 쿼리를 처리하고 요청 된 패턴 또는 이벤트를 찾기 위해 새로운 "쿼리 엔진"을 구축하고 있습니다. 분산 엔진은 클라우드 네트워크를 통해 여러 서버에서 실행되어 속도가 크게 높아집니다..
“엔진을 건축하는 것은 프로젝트의 핵심 부분입니다.”라고 그녀는 말했습니다. "전통적으로 엔진은 쿼리에 대한 모든 답을 생성하고 저장 한 다음 계산을 시작할 수 있습니다. 너무 시간이 많이 걸리고 비싸다. 현재 기술은 복잡한 쿼리를 처리하는 데 몇 시간이 걸리거나 더 오래 걸릴 수있다.
데이터 과학 박사 후보 인 Allison Rozet과 함께 개발중인 새로운 이벤트 트렌드 분석 소프트웨어는 건강 관리 센터와 금융 거래 처리 회사가 제공 한 실제 데이터 세트 및 응용 프로그램을 사용하여 테슬롯 머신됩니다.
68547_68970