본문 바로가기
데블챌

[데블챌 3일차] 데이터 모델링: 속성과 관련된 주제 3가지

by 만델 2024. 5. 30.

출처

속성 톺아보기

 

위 글에서는 데이터 모델링 속성과 관련된 아래 3가지 주제를 다뤘습니다.

1. 데이터 표준화

  • 이음동의어 최소화: 데이터 모델링 시 속성명이 유사한 의미로 다른 용어로 정의되지 않도록 주의해야 합니다.
  • 동음이의어 최소화: 속성명이 해당 속성에 속한 데이터를 명확히 설명할 수 있도록 만들어야 합니다.

2. 식별자

  • 식별자의 역할: 데이터 정규화 기준으로 사용됩니다.
  • 고유한 값으로 관리: 개체를 고유하게 식별하기 위해 유일한 값으로 관리해야 합니다. 식별자는 곧 개체를 나타냅니다.

3. 유연함을 가진 속성 모델링

  • 설계 후 데이터 추가가 필요한 경우가 있습니다.
  • 컬럼 하나를 추가하는 것이 까다로울 수 있습니다. 이는 시스템 오류 발생 가능성을 내포합니다.
  • JSON: 유연함을 가진 데이터 타입입니다. 그러나 분석가 입장에서는 뎁스가 깊어지면 구조가 복잡해집니다.
  • Google BigQuery의 속성 유연성: Google Analytics를 위한 서비스로 데이터 구조의 유연성이 뛰어납니다.

인사이트

  • 모델 속성에 대한 꿀팁을 얻었습니다:
    • 속성이 유사한 의미로 다른 용어로 정의되지 않았는지 확인해야 한다는 것을 깨달았습니다.
    • 속성명이 해당 속성에 속한 데이터를 명확히 설명할 수 있게 만들어야 한다는 것을 깨달았습니다.
    • 추후 스키마 구조 변경을 대비하여 유연하게 모델링하는 것을 고민해봐야 할 것 같습니다.
  • 아직 큰 규모의 모델링은 경험하지 않았지만, 위 개념을 알면 데이터베이스 구조 이해와 노션의 데이터베이스 설계를 수월하게 할 수 있을 것으로 기대합니다. 🚀