본문 바로가기

Tech lab8

[Kylin OLAP 가이드 4/4] Kylin 5 클러스터 구축 : Kubernetes & MinIO(S3) 기반 고가용성 OLAP 시스템 설계 이 가이드는 apachekylin/apache-kylin-standalone:5.0.2-GA Docker 이미지를 사용하여 Kubernetes 클러스터에 Kylin 5 (1개의 Job Server + 3개의 Query Server)를 배포하고 MinIO (S3)를 연동하는 단계를 안내합니다. 📌 필수 조건시작하기 전에 다음 구성 요소 및 설정이 준비되어 있는지 확인하세요.​Kylin Docker 이미지: apachekylin/apache-kylin-standalone:5.0.2-GA Kubernetes 클러스터: 워커 노드: 각 5코어 및 32GB 메모리 (총 15코어, 96GB)를 가진 3개 노드. Kylin 클러스터: 1개 Job Server Pod + 3개 Query Server Pod. Hi.. 2025. 7. 14.
[Kylin OLAP 가이드 3/4] Apache Kylin 5 성능 최적화: 차세대 OLAP 엔진의 아키텍처 혁신 ​안녕하세요! 오늘은 대규모 데이터 분석을 위한 OLAP 엔진, Kylin의 기본적인 사용 방법에 대해 알아보겠습니다. Kylin은 빅데이터 환경에서 빠른 쿼리 응답 시간을 제공하여 비즈니스 인텔리전스 (BI) 및 분석 애플리케이션의 성능을 혁신적으로 향상시킬 수 있습니다.​Kylin 도입의 배경 및 Kylin Cube 시스템 상세 이해​Apache Kylin이 빅데이터 분석 환경에 도입될 필요성과 Kylin의 핵심인 OLAP Cube 시스템에 대한 상세한 설명은 [Kylin OLAP 가이드 1/4] Apache Kylin 4 아키텍처 분석: OLAP 큐브 모델링 및 쿼리 최적화 심층 가이드를 참고해 주십시오. 해당 문서에서 Kylin의 탄생 배경, 대규모 데이터 환경에서의 필요성, 그리고 OLAP 큐브.. 2025. 7. 14.
[Kylin OLAP 가이드 2/4] Kylin 4.0.1 시스템 배포: Kubernetes & MinIO(S3) 기반 환경 구축 ​이 가이드는 MinIO(S3)를 스토리지로 사용하고 Trino 기반의 Hive Metastore와 통합하여 Kubernetes 환경에 Apache Kylin 4.0.1을 설치하고 구성하는 단계를 상세히 설명합니다. 이 설정은 Kylin Docker 이미지가 번들된 Hadoop 및 ZooKeeper 구성 요소를 동일한 Pod 내에서 실행하여 배포를 간소화한다고 가정합니다. 📌 필수 조건 시작하기 전에 다음 구성 요소 및 설정이 준비되어 있는지 확인하세요.​Kylin Docker 이미지: apachekylin/apache-kylin-standalone:kylin-4.0.1-mondrianKubernetes 클러스터: 워커 노드: 각 5코어 및 32GB 메모리 (총 15코어, 96GB)를 가진 3개 노드... 2025. 7. 9.
[Kylin OLAP 가이드 1/4] Apache Kylin 4 아키텍처 분석: OLAP 큐브 모델링 및 쿼리 최적화 심층 가이드 안녕하십니까. 오늘은 대규모 데이터 분석을 위한 OLAP 엔진, Apache Kylin 4의 기본적인 활용 방법에 대해 안내해 드립니다. Kylin 4는 빅데이터 환경에서 빠른 쿼리 응답 시간을 제공하여 비즈니스 인텔리전스(BI) 및 분석 애플리케이션의 성능을 향상시키는 데 기여합니다. Kylin 도입의 필요성 및 이점 빅데이터 환경에서 기업들은 페타바이트 규모의 데이터를 축적하고 있지만, 이러한 방대한 데이터로부터 신속하게 비즈니스 인사이트를 도출하는 것은 여전히 큰 도전입니다. 전통적인 하둡 기반의 배치 처리 시스템(예: Hive)은 대규모 데이터 처리에는 적합하나, 비즈니스 사용자들이 요구하는 수초 이내의 대화형(Interactive) 분석 쿼리 응답 시간을 충족시키기 어렵습니다. 이는 BI 도구와.. 2025. 7. 9.
PostgreSQL 과 MySQL 특징 및 성능 비교 안정적인 서비스 구축을 위해서는 여러 가지 요소가 뒷받침되어야 하지만 그중 중요한 요소 중 하나는 DB(데이터베이스)입니다. 사용자에게 최적화된 정보를 제공하기 위해서 회원 정보를 저장하거나 사용자가 원하는 데이터를 제공하기 위해 데이터를 저장하는 등 서비스에서 DB의 역할은 큰 비중을 차지하고 있습니다. 웹사이트 검색, 구인 공고 등 여러 가지 기준을 통하여 DB에 대한 각종 통계를 만들어주는 db-engines 에는 현재 385개의 DB에 대한 통계를 내고 있습니다. DB-Engines RankingPopularity ranking of database management systems.db-engines.com 2025년 5월을 기준으로 전통의 RDBMS 들이 강세를 보이는 것을 알 수 있습니.. 2025. 5. 23.
AI를 제조업에서 사용하다면? (feat. Cropper) 안녕하세요! 데이터로 일하는 데이터엔지니어스랩입니다.👋👋 인공지능은 이미 우리 삶에 많은 변화를 가져다주었습니다. 이제는 ChatGPT가 없이는 업무를 할 수 없을 정도로 자신의 라이프스타일과 환경에 맞추어 사용하는 개인이 늘어나고 있습니다. 이를 증명하듯 수많은 활용 강좌와 팁 그리고 영상이 홍수를 이루고 있습니다. 그에 맞춰서 AI를 업무에 사용하려는 다양한 시도들도 함께 일어나고 있고 많은 분야에서 이미 높은 효율과 높은 생산율을 보여주고 있고 실제로 검증된 사례도 흔하지 않게 볼 수 있습니다. 하지만 여전히 해결해야 할 문제들도 존재합니다. 대표적으로 불확실한 보안 문제를 가지고 있습니다. AI는 사전 학습된 데이터를 기반으로 추론하여 답변을 생성합니다. 이 과정에서 의도치 않게 우리의 데.. 2025. 5. 9.