Let's upgrade IT Tech/BigData(3)
-
Data Lake > Data Warehouse > Data Mart
데이터 마트, 데이터 레이크, 데이터 웨어하우스는 모두 기업에서 데이터를 수집, 저장, 분석하기 위해 사용되는 데이터 저장소입니다. 그러나 이들은 각각 목적, 구성, 사용하는 기술 등에서 차이가 있습니다. 데이터 마트(Data Mart) 데이터 마트는 기업 내에서 특정 부서나 프로젝트를 위해 구축된 비교적 작은 규모의 데이터 저장소입니다. 특정 주제나 분석 요구 사항에 맞게 설계되어 데이터를 수집, 저장, 분석합니다. 예를 들어, 판매 부서에서는 판매 거래 내역 데이터 마트를 구축하여 특정 기간의 판매 데이터, 고객 정보, 재고 정보 등을 수집하고 분석합니다. 데이터 마트는 데이터 웨어하우스와는 달리 특정 비즈니스 요구사항에 맞게 구축되기 때문에 비교적 구축이 쉽고 빠릅니다. 데이터 웨어하우스(Data ..
2023.03.29 -
머신러닝과 딥러닝
머신러닝 기본적으로 머신러닝(Machine Learning)은 데이터를 분석하여 패턴을 찾고, 그 패턴을 이용해 새로운 데이터를 예측하거나 분류하는 알고리즘을 개발하는 분야입니다. 머신러닝은 지도학습(Supervised Learning), 비지도학습(Unsupervised Learning), 강화학습(Reinforcement Learning) 등의 방법으로 구현될 수 있습니다. 딥러닝 딥러닝(Deep Learning)은 머신러닝의 한 분야로, 인공신경망(Artificial Neural Networks)을 이용해 복잡한 문제를 해결하는 기술입니다. 딥러닝은 머신러닝의 일종이지만, 더 많은 데이터와 더 복잡한 모델을 사용해 문제를 해결합니다. 이를 통해 이미지 인식, 음성 인식, 자연어 처리 등 다양한 분야..
2023.03.27 -
HDFS Swap이란
HDFS Swap은 Hadoop Distributed File System(HDFS)에서 데이터 노드의 메모리 부족 문제를 해결하기 위한 메커니즘입니다. HDFS Swap은 디스크 기반의 가상 메모리이며, 메모리 부족 상황에서는 데이터 노드의 일부 데이터를 디스크로 스왑 아웃하여 메모리를 확보합니다. HDFS Swap은 기본적으로 HDFS 데이터 노드에서 활성화되어 있으며, 노드의 메모리가 부족해지면 Swap 영역으로 데이터를 이동시켜서 메모리를 확보합니다. Swap 영역은 디스크 공간을 사용하며, 디스크 I/O는 매우 느리므로 Swap 영역으로 이동된 데이터의 액세스 속도는 느려집니다. HDFS Swap은 데이터 노드의 부하와 성능 저하를 일으킬 수 있으므로, Swap이 자주 발생하는 경우에는 데이터 ..
2023.03.17