본문 바로가기
SingleStoreDB/웨비나

Webinar: 시계열 데이터에 적합한 데이터베이스 선택

by 에이플랫폼 [Team SingleStore Korea] 2019. 8. 12.

이 Webinar에서 SingleStore 제품 마케팅 관리자 Mike Boyarski는 시계열 데이터의 인기 증가에 대해 설명하고 라이브 Q&A를 포함하여 시계열 데이터베이스에 가장 적합한 옵션에 대해 설명합니다. Webinar를 보고 여기에서 슬라이드를 다운로드할 수 있습니다.


SingleStore에서는 시계열 데이터시계열 데이터베이스 선택 및 O'Reilly 시계열 전자책 다운로드에 대한 블로그 게시물에 많은 관심을 보였습니다. 또한 DZone의 시계열 데이터베이스 아키텍처에 대한 Webinar가 있습니다.

이와 대조적으로 이 Webinar는 시계열 데이터베이스에서 원하는 것과 SingleStore에 적합한 방법을 설명하는 데 특히 유용합니다. 이 블로그 게시물을 읽고 Webinar를 보십시오.

시계열 데이터는 시계열 데이터(더 많고 저렴한 센서) 생성, 전송 속도(빠른 온라인 및 무선 연결), 저장(더 나은 데이터베이스), 그에 대한 조치(더 응답성이 높은 웹 사이트 및 기타 온라인 시스템) 및 보고(더 나은 분석 도구)가 점점 더 쉬워지고 있기 때문에 사용량이 증가하고 있습니다.

지난 12개월 동안 시계열 데이터베이스에 대한 관심이 급격히 증가했습니다.

 

시계열 데이터는 장치 모니터링, 유정과 같은 에너지 시스템, 제조, 컴퓨터 운영, 재무 가격 및 거래, 마케팅 자동화에 사용됩니다. 모든 종류의 신호에 대한 실시간 응답을 위해 경고, 모니터링 및 점점 더 중요해지는 사용량에 사용할 수 있습니다.

일례로, 전자 상거래 사이트는 현재 인기있는 제품의 판매를 모니터링ㅐ할 수 있습니다. 이 사이트는 판매 동향과 관련성 데이터를 결합하여 각 방문자에게 가장 인기있는 제품을 제공할 수 있습니다.

시계열 데이터는 수명주기를 거칩니다. 압력 밸브 판독 또는 완료된 트랜잭션과 같은 실제 이벤트를 반영하기 위해 소프트웨어에 의해 생성됩니다. 그런 다음 데이터는 종종 파이프 라인으로 들어가서 발행자로부터 데이터를 이동시키고 데이터 복구 및 여러 잠재적 소비자로 이동하는 기능과 같은 기능을 제공합니다.

파이프 라인에서 데이터는 소프트웨어에 의해 변환됩니다. 예를 들어 데이터를 정규화하거나 다시 포맷할 수 있습니다. 예를 들어, 몇 초 간격의 일련의 판독 값을 JSON을 사용하여 분당 단일 레코드로 통합하여 결과로 반정형 데이터를 처리할 수 ​​있습니다. SingleStore을 사용하면 파이프라인스토어드 프로시저를 사용하여 수집 중에 처리할 수 있습니다 .

시계열 데이터에는 자체 수명주기가 있습니다.

 

시계열을 효과적으로 지원하려면, 데이터베이스는 트랜잭션 지원 능력, 확장성, 운영 데이터베이스로서의 효과, 분석에 대한 유용성과 응답성 측면에서 특정 요구사항을 충족해야 합니다.

Mike는 이러한 측면에서 트랜잭션 지원, 확장성, 운영 기능 및 분석 지원과 같은 다양한 종류의 데이터베이스에 대한 요약 평가를 제공합니다. 예를 들어, NoSQL 데이터베이스는 확장 가능할 수 있지만 SQL을 지원하지 않는다는 사실 때문에 분석에 유용하지는 않습니다.

다른 종류의 데이터베이스는 시계열 데이터에 대해 서로 다른 장단점이 있습니다.

 

NBA, NFL, Champions League football (축구) 팀 등의 브랜드 팀 상품의 리더인 Fanatics는 SingleStore 고객입니다. 또한 사용중인 시계열 데이터의 훌륭한 예입니다.

Fanatics가 웹 사이트, 모바일 사용자 및 POS(Point of Sale) 시스템에서 사용하는 모든 데이터에는 시계열 측면이 있습니다. 예를 들어 NFL 플레이 오프에서 수퍼볼 경쟁자와 우승자를위한 팀 유니폼 판매가 급증할 것입니다.

열광적인 팬들은 큰 게임에 시작할 때 시계열 데이터를 사용하여 우승팀의 셔츠(jersey) 판매를 예측하고, 그에 따라 생산을 준비할 수 있습니다. 도대체 그들은 누가 각각의 슈퍼볼을 이길 것인지에 대한 예측을 가지고 있을 수도 있습니다.

여러 종류의 시계열 데이터를 수집하는 Fanatics의 FanFlow 분석 아키텍처는 SingleStore에 의해 구동됩니다.

 

Webinar는 시계열에 대한 질문과 답변, SingleStore 및 SingleStore와 다른 데이터베이스의 구현을 포함한 간단한 Q&A로 마무리되었습니다.

스트리밍하는 동안 SingleStore가 무결성 제약 조건을 수행합니까?

물론입니다. 전체 검사는 데이터가 얼마나 빨리 들어오는지에 달려 있습니다.

오래된 데이터가 급증하면 어떻게 해야 합니까? 예를 들어 일부 기기는 인터넷에 연결되어 있지 않기 때문에 데이터가 급격히 증가합니다.

SingleStore를 사용하면 트랜잭션 기능을 사용하여 순서를 벗어난 데이터를 통합할 수 있습니다. 또한 SingleStore와 함께 제공되는 도구를 사용하여 간격이 있는 데이터 계열에 대한 올바른 답변을 제공하는 쿼리를 작성할 수 있습니다.

SingleStore은 Redis에 반하여 어떻게 수행합니까?

Redis는 분석이 다소 제한되어 있으므로 탐색적 분석에는 적합하지 않습니다. 이를 지원하려면 데이터를 다른 도구로 복사해야 합니다. SingleStore는 그럴 필요가 없습니다.

SingleStore를 사용하면 데이터 레이크(Lake) 사용을 건너뛸 수 있다고 말할 수 있습니까?

예, 데이터 레이크 대신 SingleStore를 사용하는 고객이 있습니다. 그러나 HDFS 커넥터도 있으므로 Hadoop을 데이터 레이크로 사용하고 적절한 데이터 또는 모든 데이터를 SingleStore로 옮길 수도 있습니다.

SingleStore은 Snowflake와 어떻게 비교됩니까?

Snowflake는 SingleStore와 마찬가지로 데이터 웨어하우징에 매우 적합한 단일 워크로드 환경입니다. 우리가 다른 점은 SingleStore는 빠른 데이터 수집을 위해 추가로 설계되었으며 훨씬 더 나은 성능을 제공한다는 것입니다. Singlestore는 또한 Snowflake를 위한 두 곳의 퍼블릭 클라우드에 비해 기본적으로 모든 곳에서 더 많은 장소(region)에서 운영합니다. Snowflake를 계속 실행하면 상당히 비쌀 수 있습니다.

 

February 26th, 2019

Floyd Smith

 


출처: https://www.singlestore.com/blog/webinar-choosing-database-time-series-data/

 

Webinar: Choosing the Right Database for Time Series Data

Time series data has unique processing requirements that cross boundaries between transactions, real-time alerting, and ad hoc queries. Performance, scalability, and SQL support are required all at once, not one at a time.

www.singlestore.com

 

​※ www.a-platform.biz | info@a-platform.biz