
Dremio là một nền tảng SQL phân tán giúp phân tích dữ liệu lớn một cách hiệu quả. Bài viết này sẽ đi sâu vào kiến trúc của Dremio, khám phá cách các thành phần như Coordinator Node và Executor Node hoạt động, và làm sáng tỏ cơ chế của Query Engine, từ đó giúp bạn hiểu rõ hơn về hệ thống mạnh mẽ này.

Apache Spark là một công cụ mạnh mẽ cho xử lý dữ liệu lớn. Bài viết này sẽ khám phá kiến trúc Spark với các thành phần chính như Driver, Executor, và cách chúng hoạt động trong một Cluster Manager. Qua đó, bạn sẽ hiểu rõ hơn về Workflow xử lý dữ liệu trong Spark.