용어 data 우리에게 새로운 것이 아닙니다. 정보 기술과 컴퓨터를 선택할 때 배우는 기본 사항 중 하나입니다. 기억할 수 있다면 데이터는 원시 형태의 정보로 간주됩니다. 이미 10년 동안 존재했지만, 그 용어는 Big Data 요즘 화제다. 데이터의 로드 및 로드라는 용어에서 알 수 있듯이 빅 데이터는 필요한 정보를 확보하기 위해 다양한 방법과 도구를 사용하여 다양한 방식으로 처리될 수 있습니다. 이 글은 빅데이터의 개념에 대해 이야기하고, 데이터웨어하우징 분야의 선구자인 Doug Laney가 언급한 3Vs를 사용하여 Infonomics (정보경제학).

계속 진행하기 전에 빅 데이터의 기본 및 빅 데이터 사용에 대한 기사를 읽고 본질을 파악하는 것이 좋습니다. 그들은 빅 데이터 개념에 대한 설명을 이 게시물에 추가할 수 있습니다.

빅 데이터 3 대

다양한 수단을 통해 축적된 거대한 형태의 데이터는 이전에 다른 데이터베이스에 적절하게 보관되고 일정 시간이 지나면 버려집니다. 데이터가 많을수록 올바른 도구를 사용하여 서로 다른 관련 정보를 더 쉽게 찾을 수 있다는 개념이 등장하자 기업은 더 오랜 기간 데이터를 저장하기 시작했습니다. 이는 새로운 저장 장치를 추가하거나 클라우드를 사용하여 문서, 스프레드시트, 데이터베이스, HTML 등 조달된 데이터 형식에 관계없이 데이터를 저장하는 것과 같습니다. 그런 다음 방대한 양의 데이터를 처리할 수 있는 도구를 사용하여 적절한 형식으로 정렬됩니다. 데이터.

참고: 빅 데이터의 범위는 구내 및 클라우드에서 수집 및 저장하는 데이터에 국한되지 않습니다. 여기에는 공개 도메인의 항목을 포함하되 이에 국한되지 않는 다른 소스의 데이터가 포함될 수 있습니다.

빅 데이터의 3D 모델은 다음 Vs를 기반으로 합니다.

  1. 볼륨: 데이터 저장소의 관리를 나타냅니다.
  2. 속도: 데이터 처리 속도를 나타냅니다.
  3. 다양성(Variety): 서로 관련이 없어 보이는 데이터 세트의 데이터를 그룹화하는 것을 말합니다.

다음 단락에서는 각 차원(각 V)에 대해 자세히 이야기하여 빅 데이터 모델링을 설명합니다.

가]빅데이터의 양

빅 데이터에 대해 이야기하면 볼륨을 원시 정보의 거대한 모음으로 이해할 수 있습니다. 그것이 사실이지만 데이터의 저장 비용에 관한 것이기도 합니다. 중요한 데이터는 온프레미스와 클라우드에 저장할 수 있으며 후자는 유연한 옵션입니다. 하지만 저장과 모든 것이 필요합니까?

Meta Group이 발표한 백서에 따르면 데이터의 양이 증가하면 데이터의 일부가 불필요해 보이기 시작합니다. 또한 기업에서 사용하려는 데이터의 양만 보유해야 한다고 명시되어 있습니다. 다른 데이터는 폐기될 수 있으며, 기업이 데이터를 공개하기를 꺼리는 경우 supposedly non-important data, 사용하지 않는 컴퓨터 장치와 테이프에도 버릴 수 있으므로 기업에서는 이러한 데이터를 저장하는 데 비용을 지불할 필요가 없습니다.

나는 사용했다 supposedly unimportant data 나도 조만간 어떤 유형의 데이터도 모든 비즈니스에 필요할 수 있다고 믿기 때문에 데이터가 실제로 중요하지 않다는 것을 알기 전에 상당한 시간 동안 보관해야 합니다. 개인적으로 나는 과거의 오래된 데이터를 하드 디스크에 덤프하고 때로는 DVD에 덤프합니다. 메인 컴퓨터와 클라우드 스토리지에는 내가 중요하게 생각하고 사용하게 될 데이터가 포함되어 있습니다. 이 데이터 중에는 몇 년 후에 오래된 HDD에 저장될 수 있는 1회용 데이터도 있습니다. 위의 예는 이해를 돕기 위한 것입니다. 기업이 빅 데이터로 인식하는 양에 비해 양이 상당히 적기 때문에 빅 데이터에 대한 설명에는 적합하지 않습니다.

나]빅데이터의 속도

빅데이터의 개념을 말할 때 데이터 처리 속도는 중요한 요소입니다. 많은 웹사이트, 특히 전자 상거래가 있습니다. Google은 페이지 로드 속도가 더 나은 순위를 위해 필수적이라는 것을 이미 인정했습니다. 순위 외에도 속도는 사용자가 쇼핑하는 동안 편안함을 제공합니다. 다른 정보를 위해 처리 중인 데이터에도 동일하게 적용됩니다.

속도에 대해 이야기하는 동안 속도가 더 높은 대역폭을 넘어선다는 것을 아는 것이 중요합니다. 쉽게 사용할 수 있는 데이터를 다양한 분석 도구와 결합합니다. 쉽게 사용할 수 있는 데이터는 처리하기 쉬운 데이터 구조를 만들기 위한 몇 가지 숙제를 의미합니다. 다음 차원 – 다양성은 이에 대한 추가 정보를 퍼뜨립니다.

다]다양한 빅데이터

데이터의 로드와 로드가 있을 때 분석 도구가 데이터를 쉽게 처리할 수 있는 방식으로 데이터를 구성하는 것이 중요합니다. 데이터를 구성하는 도구도 있습니다. 저장할 때 데이터는 구조화되지 않고 모든 형식이 될 수 있습니다. 다른 데이터와 어떤 관계가 있는지 파악하는 것은 사용자의 몫입니다. 관계를 파악하면 적절한 도구를 선택하고 데이터를 구조화되고 정렬된 저장을 위해 원하는 형식으로 변환할 수 있습니다.

요약

즉, Big Datas 3D Model은 3차원을 기반으로 합니다. 데이터의 적절한 태깅; 그리고 더 빠른 처리. 이 세 가지만 관리하면 데이터를 쉽게 처리하거나 분석하여 원하는 것을 파악할 수 있습니다.

위의 내용은 빅 데이터의 개념과 3D 모델을 모두 설명합니다. 두 번째 단락에 링크된 기사는 개념이 처음인 경우 추가 지원을 증명할 것입니다.

추가하고 싶은 내용이 있으면 댓글을 달아주세요.