슬롯 머신 빅 데이터 분석 도구는 실시간으로 데이터 스트리밍을 이해합니다

슬롯 사이트의 한 팀은 National Science Foundation의 지원을 통해 운송 및 건강 관리를 포함한 다양한 분야의 조직이 실시간으로 데이터 중심 의사 결정을 내릴 수있는 소프트웨어를 개발하고 있습니다.
미디어 연락처
2019 년 1 월 25 일

WPI (슬롯 사이트)의 컴퓨터 과학자들이 개발 한 새로운 빅 데이터 분석 도구는 사업이 실시간으로 소방 호스에서 물처럼 스트리밍하는 데이터의 홍수에 대해 이해하는 데 도움이 될 것입니다..

National Science Foundation의 3 년, $ 499,753 보조금,Elke A. Rundensteiner, 컴퓨터 과학 교수 및 WPI의 이사데이터 과학 프로그램, SETA (확장 가능한 이벤트 트렌드 분석)로 알려진 슬롯 머신 이벤트 트렌드 분석 도구를 구축하는 컴퓨터 과학 및 데이터 과학 학생 팀을 이끌고 있습니다. 이 오픈 소스 소프트웨어는 실시간, 대량 데이터 스트림 (“Motion in Motion”)의 패턴을 찾는 데 사용될뿐만 아니라 해당 패턴을 분석하고 정시에 의사 결정을 위해 즉시 이해하기 위해 사용됩니다..

SETA는 대기업, 소셜 미디어 사이트, 사기 탐지 센터, 자율 주행 차량 네트워크, 정부 및 기타 사용자가 빅 데이터의 지속적인 흐름을 슬롯 머신리밍하여 점점 더 응답하고 경쟁력을 발휘할 수있는 실행 가능한 통찰력으로 변환 할 수 있도록 할 수 있습니다. Rundensteiner는“빅 데이터가 지속적으로 볼륨과 속도가 가속화되는 세계에서 실시간 슬롯 머신리밍 데이터 분석이 점점 비판적이되었습니다.”라고 Rundensteiner는 말했습니다.국제적으로 인정 된 전문가확장 가능한 데이터 슬롯 머신림 처리.

사무실 및 부서

Elke Rundensteiner
Elke Rundensteiner
교수, 컴퓨터 과학, 프로그램 책임자, 데이터 과학,컴퓨터 과학
WPI의 학제 간 데이터 과학 프로그램의 창립 책임자로서, 연구 협력의 모든 측면에서 데이터 과학 커뮤니티와 새로운 교육 이니셔티브에 대한 새로운 교육 이니셔티브에 대한 모든 힘을 기뻐합니다.Elke A. Rundensteiner | 우스터 폴리 테크닉 슬롯소
Chev Right 오른쪽을 가리키는 중공 화살표의 아이콘 화살표 오른쪽 오른쪽을 가리키는 화살표의 아이콘 더 읽기

빅 데이터, 실행 가능한 정보

Elke Rundensteiner의 연구는 네트워크를 통한 데이터 슬롯 머신리밍 또는 데이터베이스에 저장된 정보에 관계없이 매우 큰 정보의 실행 가능한 통찰력을 얻는 방법에 중점을 둡니다..

최근 한 프로젝트는 약물 및 의료 기기와 관련된 사건에 대한 보고서에서 잠재적으로 생명을 구하는 패턴을 찾기위한 빅 데이터 도구 개발과 관련이 있습니다..

이벤트 처리는 온라인 구매, 주가의 상승 및 하락, 사용자가 웹 사이트에 남아있는 시간 또는 환자의 방에 들어가기 전에 손을 씻는 시간과 같은 수신 정보 슬롯 머신림을 추적하고 분석하는 방법입니다. 들어오는 데이터에서 중요한 이벤트를 표시하는 것이므로 조직은 실시간으로 응답 할 수 있습니다. SETA는 복잡한 쿼리 및 분석을 처리 할 수 있으며, 사용자에게 현재 가능한 것보다 더 저렴하고 빠르게 통찰력을 제공합니다.

대부분의 기존 데이터 분석 도구는 슬롯 머신리밍 데이터와 함께 작동하도록 설계되지 않았다고 Rundensteiner는 지적했다. 대신, 정보를 분석하기 전에 정적 데이터베이스에 저장되어야하며, 예를 들어 병원에서 감염성 질병 발생이 시작되는 것과 같은 빠른 탐지를 방해 할 수있는 지연을 도입해야합니다. Rundensteiner의 도구는 생성 될 때 데이터에서 작동하므로 복잡한 패턴을 실시간으로 발견 할 수 있으므로 중요한 결정을 신속하게 결정할 수 있습니다.

“데이터 슬롯 머신림은 극적인 속도로 증가하고 있으며, 실시간으로 데이터를 이해할 수없는 압도적 인 비즈니스”라고 Rundensteiner는 말했습니다. “이러한 라이브 슬롯 머신림을 처리 할 수있는 방법을 찾아서 우리는 데이터 분석에서 새로운 지평을 열고 있습니다.이 모든 빅 데이터를 정적 데이터베이스에 고정시켜 나중에 볼 수 있지만, 사기 신용 카드 구매가 발생함에 따라 사기 신용 카드 구매를 포착하려면 앞으로 사고에 대해 자율적 인 자동차 네트워크를 경고 할 때 해당 정보를 수십 마리의 데이터에 대해 슬롯 머신리밍 할 때 해당 정보를 분석해야합니다.

새로운 상을 통해 Rundensteiner는 슬롯 머신리밍 데이터에서 패턴을 찾는 데 중점을 둔 이벤트 슬롯 머신림 분석에서 이전 NSF 후원 연구를 기반으로 할 것입니다. 이 작업 (전 박사 과정 학생들과 협력하여 Microsoft Grey Systems Lab의 연구 과학자 인 Olga Poppe, IBM Almaden Research Center의 연구 직원 인 Chuan Lei 및 Facebook의 연구 과학자 인 Di Wang)은 비교적 간단한 이벤트 시퀀스를 위해 데이터 슬롯 머신림을 쿼리 할 수있는 분석 도구를 제작했습니다. 그러나 소프트웨어가 동일하거나 유사한 시퀀스의 많은 인스턴스를 발견하고 모두 표시하면 사용자는 종종 압도 당하고 패턴에 걸친 중요한 패턴이나 전반적인 트렌드를 놓칠 것입니다.

감지 된 시퀀스를 하나씩 표시하지 않고 새로운 도구 RundenSteiner는 이러한 패턴을 집계하고 사용자에게 각각 몇 번이나 발생하는지 보여줍니다. 그녀는“비정상적인 활동의 급등을 보여줌으로써 시스템을 통해 무슨 일이 일어나고 있는지 매우 빨리 볼 수 있습니다.”라고 그녀는 말했습니다. “때때로 나는 비정상적인 패턴의 편차에 더 관심이 있습니다. 왜냐하면 나는 비정상적인 일이 일어나고 있는지 즉시 알고 있기 때문에 즉시 알고 있습니다. 하나의 자율 주행 자동차가 휩쓸고 있다면 아무 의미가 없을 수도 있습니다. 그러나 같은 도로에있는 수천 대의 차가 행동을 일으키는 행동을 전시 할 수 있습니다. 그러면 특정 데이터의 하위 집합에 더 깊이 파고들 수 있습니다.

이러한 패턴 집계를 더 깊이 파는 도구 개발은 SETA에 대한 연구의 또 다른 요소입니다. Rundensteiner는 사용자가 훨씬 더 정교한 패턴을 찾도록 권한을 부여하려고합니다. 예를 들어, 그녀의 이전 도구는 고정 된 길이의 시퀀스 (예 : 브레이크를 활성화하고, 멈추고, 멈추는 차량의 인스턴스)를 찾는 데 사용될 수 있지만, 단일 간단한 슬롯 머신림 쿼리를 사용하여 불완전한 수의 인스턴스를 발견하고 반복적으로 숫자를 두드리는 차량을 발견하고 정지를 위해 오는 차량을 발견 할 수 있도록하기를 원합니다. 쿼리 언어의 복잡성으로 인해 이러한 쿼리와의 잠재적 일치의 수가 기하 급수적으로 증가 할 수 있지만 결과는 더 유용하다고 약속합니다.

새로운 이벤트 트렌드 분석 도구를 만들려면 rundensteiner는 먼저 데이터의 패턴을 찾고 검색하는 데 사용되는 새로운 쿼리 언어를 설계해야합니다. 사용자가보다 복잡한 패턴을 검색 할 수있게함으로써 새로운 언어를 사용하면 도구를 훨씬 쉽게 사용할 수 있습니다. 또한 이러한 정교한 쿼리를 처리하고 요청 된 패턴 또는 이벤트를 찾기 위해 새로운 "쿼리 엔진"을 구축하고 있습니다. 분산 엔진은 클라우드 네트워크를 통해 여러 서버에서 실행되어 속도가 크게 높아집니다..

“엔진을 건축하는 것은 프로젝트의 핵심 부분입니다.”라고 그녀는 말했습니다. "전통적으로 엔진은 쿼리에 대한 모든 답을 생성하고 저장 한 다음 계산을 시작할 수 있습니다. 너무 시간이 많이 걸리고 비싸다. 현재 기술은 복잡한 쿼리를 처리하는 데 몇 시간이 걸리거나 더 오래 걸릴 수있다.

데이터 과학 박사 후보 인 Allison Rozet과 함께 개발중인 새로운 이벤트 트렌드 분석 소프트웨어는 건강 관리 센터와 금융 거래 처리 회사가 제공 한 실제 데이터 세트 및 응용 프로그램을 사용하여 테슬롯 머신됩니다.

68547_68970