출처
위 글에서는 데이터 모델링 속성과 관련된 아래 3가지 주제를 다뤘습니다.
1. 데이터 표준화
- 이음동의어 최소화: 데이터 모델링 시 속성명이 유사한 의미로 다른 용어로 정의되지 않도록 주의해야 합니다.
- 동음이의어 최소화: 속성명이 해당 속성에 속한 데이터를 명확히 설명할 수 있도록 만들어야 합니다.
2. 식별자
- 식별자의 역할: 데이터 정규화 기준으로 사용됩니다.
- 고유한 값으로 관리: 개체를 고유하게 식별하기 위해 유일한 값으로 관리해야 합니다. 식별자는 곧 개체를 나타냅니다.
3. 유연함을 가진 속성 모델링
- 설계 후 데이터 추가가 필요한 경우가 있습니다.
- 컬럼 하나를 추가하는 것이 까다로울 수 있습니다. 이는 시스템 오류 발생 가능성을 내포합니다.
- JSON: 유연함을 가진 데이터 타입입니다. 그러나 분석가 입장에서는 뎁스가 깊어지면 구조가 복잡해집니다.
- Google BigQuery의 속성 유연성: Google Analytics를 위한 서비스로 데이터 구조의 유연성이 뛰어납니다.
인사이트
- 모델 속성에 대한 꿀팁을 얻었습니다:
- 속성이 유사한 의미로 다른 용어로 정의되지 않았는지 확인해야 한다는 것을 깨달았습니다.
- 속성명이 해당 속성에 속한 데이터를 명확히 설명할 수 있게 만들어야 한다는 것을 깨달았습니다.
- 추후 스키마 구조 변경을 대비하여 유연하게 모델링하는 것을 고민해봐야 할 것 같습니다.
- 아직 큰 규모의 모델링은 경험하지 않았지만, 위 개념을 알면 데이터베이스 구조 이해와 노션의 데이터베이스 설계를 수월하게 할 수 있을 것으로 기대합니다. 🚀
'데블챌' 카테고리의 다른 글
| [데블챌 6일차] ROUGE: 문서 요약의 품질을 측정하는 지표 (0) | 2024.06.02 |
|---|---|
| [데블챌 5일차] 번역 품질을 측정하는 BLEU 스코어: 기계번역의 신뢰성을 평가하다 (0) | 2024.06.01 |
| [데블챌 4일차]Python Matplotlib 예제 정리 (0) | 2024.06.01 |
| [데블챌 2일차] 데이터 분석 쉽게 이해하기 (0) | 2024.05.29 |
| [데블챌 1일차] 데이터를 대하는 자세 (0) | 2024.05.28 |