데이터베이스키 – dsgnmstr; Design Monster

수많은 사람 속에서 ‘나’를 유일하게 증명하는 주민등록번호처럼, 방대한 데이터의 바다에서 특정 데이터를 정확하게 찾아내고 구분하기 위해서는 고유한 식별자가 반드시 필요합니다. 데이터베이스 세계에서 이 주민등록번호와 같은 역할을 하는 것이 바로 ‘키(Key)’입니다. 키는 단순히 테이블의 특정 행(Row)을 식별하는 역할을 넘어, 테이블 간의 관계를 맺어주고 데이터의 일관성과 무결성을 지키는 핵심적인 장치입니다.

만약 키가 없다면, 우리는 ‘컴퓨터공학과에 재학 중인 김정보’라는 학생의 성적을 찾기 위해 테이블의 모든 데이터를 일일이 뒤져야 할지도 모릅니다. 동명이인이라도 있다면 문제는 더욱 심각해집니다. 키는 이러한 혼란과 비효율을 막고, 데이터베이스가 질서정연하고 신뢰할 수 있는 시스템으로 작동하게 하는 근본 원리입니다. 이 글에서는 정보처리기사 시험의 필수 개념이자, 데이터베이스 설계의 심장이라 할 수 있는 다양한 종류의 키에 대해 그 개념과 관계, 그리고 중요성을 심도 있게 알아보겠습니다.

키의 종류: 목적에 따라 역할을 나누다

데이터베이스에서는 여러 종류의 키가 각기 다른 목적과 규칙을 가지고 사용됩니다. 이들의 관계를 이해하는 것이 데이터베이스 설계를 위한 첫걸음입니다.

슈퍼키 (Super Key)

슈퍼키는 테이블의 각 행을 유일하게 식별할 수 있는 속성(Attribute) 또는 속성들의 집합입니다. 유일성(Uniqueness)은 만족하지만, 최소성(Minimality)은 만족하지 않을 수 있습니다. 즉, 행을 식별하는 데 필요 없는 속성이 포함될 수 있다는 의미입니다.

예를 들어, ‘학생’ 테이블이 {학번, 주민등록번호, 이름, 학과} 속성으로 구성되어 있다고 가정해 보겠습니다.

{학번} -> 각 학생을 유일하게 식별 가능하므로 슈퍼키입니다.
{주민등록번호} -> 역시 유일하게 식별 가능하므로 슈퍼키입니다.
{학번, 이름} -> ‘학번’만으로도 충분히 식별 가능하지만, 이 조합 역시 모든 학생을 유일하게 식별할 수 있으므로 슈퍼키입니다.
{학번, 주민등록번호, 이름} -> 이 조합 또한 유일성을 만족하므로 슈퍼키입니다.

이처럼 슈퍼키는 유일하게 식별 가능한 모든 속성의 조합을 의미하는 광범위한 개념입니다.

후보키 (Candidate Key)

후보키는 슈퍼키 중에서 최소성까지 만족하는 키입니다. 즉, 각 행을 유일하게 식별할 수 있으면서, 꼭 필요한 최소한의 속성만으로 구성된 키를 말합니다. 후보키에서 속성을 하나라도 제거하면 더 이상 유일성을 만족하지 못하게 됩니다.

위의 ‘학생’ 테이블 예시에서 후보키는 다음과 같습니다.

{학번}: 유일성과 최소성을 모두 만족합니다.
{주민등록번호}: 유일성과 최소성을 모두 만족합니다.
{학번, 이름}: 최소성을 만족하지 않습니다. ‘이름’ 속성을 제거해도 {학번}만으로 유일한 식별이 가능하기 때문입니다. 따라서 후보키가 아닙니다.

후보키는 ‘기본키가 될 수 있는 후보’들이며, 모든 테이블은 하나 이상의 후보키를 반드시 가집니다.

기본키 (Primary Key, PK)

기본키는 후보키 중에서 설계자가 특별히 선택한 단 하나의 키입니다. 테이블의 모든 행은 기본키 값을 통해 유일하게 식별되고 접근됩니다. 기본키는 다음과 같은 중요한 제약 조건을 반드시 따라야 합니다.

유일성 (Uniqueness): 모든 행의 기본키 값은 유일해야 하며, 중복된 값을 가질 수 없습니다.
최소성 (Minimality): 행을 식별하는 데 필요한 최소한의 속성으로 구성되어야 합니다.
개체 무결성 (Entity Integrity): NULL 값을 가질 수 없습니다. 즉, 기본키 값은 반드시 존재해야 합니다.

설계자는 여러 후보키 중에서 가장 데이터를 잘 대표하고, 값이 변하지 않으며, 단순한 형태의 키를 기본키로 선정하는 것이 일반적입니다. ‘학생’ 테이블에서는 보통 {학번}을 기본키로 선택합니다.

대체키 (Alternate Key)

대체키는 후보키 중에서 기본키로 선택되지 않고 남은 키들을 말합니다. ‘학생’ 테이블에서 {학번}을 기본키로 선택했다면, 또 다른 후보키였던 {주민등록번호}는 대체키가 됩니다. 대체키 역시 후보키의 특성을 그대로 가지고 있으므로, 유일성과 최소성을 만족하며 NULL 값을 허용하지 않는 것이 좋습니다.

외래키 (Foreign Key, FK)

외래키는 한 테이블의 속성(또는 속성들의 집합)이 다른 테이블의 기본키를 참조하는 키입니다. 이는 테이블 간의 관계를 맺어주는 매우 중요한 역할을 하며, 데이터베이스의 ‘관계형’이라는 이름이 붙은 이유이기도 합니다. 외래키는 두 테이블을 연결하는 다리 역할을 하며, 데이터의 일관성을 보장하는 ‘참조 무결성’ 제약 조건을 설정하는 데 사용됩니다.

예를 들어, ‘수강신청’ 테이블이 있고, 이 테이블에는 어떤 학생이 어떤 과목을 신청했는지에 대한 정보가 들어있다고 가정해 봅시다.

학생 테이블: {학번(PK), 이름, 학과}
과목 테이블: {과목코드(PK), 과목명, 학점}
수강신청 테이블: {신청번호(PK), 학번(FK), 과목코드(FK), 신청일}

여기서 ‘수강신청’ 테이블의 학번은 ‘학생’ 테이블의 학번(PK)을 참조하는 외래키이고, 과목코드는 ‘과목’ 테이블의 과목코드(PK)를 참조하는 외래키입니다.

키 종류	유일성	최소성	NULL 값	역할 및 특징
슈퍼키	O	X	O	유일성을 만족하는 모든 속성의 조합
후보키	O	O	X	유일성과 최소성을 만족 (기본키 후보)
기본키	O	O	X	후보키 중 선택된 단 하나의 대표 키
대체키	O	O	X	후보키 중 기본키가 되고 남은 키
외래키	X	X	O	다른 테이블의 기본키를 참조, 관계 설정

관계의 핵심, 기본키와 외래키의 상호작용

데이터베이스의 힘은 데이터를 단순히 저장하는 것을 넘어, 데이터 간의 관계를 정의하고 유지하는 데 있습니다. 이 관계의 중심에 바로 기본키(PK)와 외래키(FK)가 있습니다. 이 둘의 조합은 ‘참조 무결성(Referential Integrity)’이라는 중요한 규칙을 강제합니다.

참조 무결성 (Referential Integrity)

참조 무결성이란 외래키의 값은 반드시 참조하는 테이블의 기본키 값으로 존재하거나, 혹은 NULL 값이어야 한다는 규칙입니다. 이 규칙은 존재하지 않는 데이터를 참조하는 것을 막아 데이터의 일관성과 신뢰도를 극적으로 높여줍니다.

앞서 들었던 ‘학생’과 ‘수강신청’ 테이블의 예를 다시 보겠습니다.

‘수강신청’ 테이블에 데이터를 삽입할 때, 학번 컬럼에는 ‘학생’ 테이블에 실제로 존재하는 학번 값만 입력할 수 있습니다. 존재하지 않는 ‘9999’라는 학번으로 수강 신청 데이터를 만들려고 하면 데이터베이스 시스템이 오류를 발생시키며 입력을 거부합니다. 이것이 바로 삽입 시의 참조 무결성입니다.
만약 ‘학생’ 테이블에서 학번 ‘1001’인 학생을 삭제하려고 할 때, ‘수강신청’ 테이블에 ‘1001’ 학생의 수강 기록이 남아있다면 어떻게 될까요? 참조 무결성 제약 조건은 이러한 삭제를 막거나, 관련된 수강신청 기록을 함께 삭제(CASCADE)하거나, 학번 값을 NULL로 설정(SET NULL)하도록 하는 등의 옵션을 제공합니다. 이를 통해 부모 없는 자식 데이터(Orphaned Record), 즉 유효하지 않은 참조 관계가 발생하는 것을 방지합니다.

이처럼 PK와 FK는 서로 긴밀하게 상호작용하며, 사용자의 실수나 논리적 오류로부터 데이터베이스를 보호하는 강력한 수호자 역할을 합니다.

복합키 (Composite Key)

때로는 하나의 속성만으로는 행을 유일하게 식별할 수 없어 두 개 이상의 속성을 조합해야만 기본키 역할을 할 수 있는 경우가 있습니다. 이렇게 두 개 이상의 속성을 묶어 만든 기본키를 복합키라고 합니다.

예를 들어, M:N 관계를 해소하기 위해 만들어지는 연결 테이블에서 복합키가 자주 사용됩니다. ‘수강신청’ 테이블에서 신청번호 없이 {학번, 과목코드}를 조합하여 기본키로 사용할 수 있습니다. ‘한 학생은 한 과목을 한 번만 신청할 수 있다’는 규칙이 있다면, 이 두 속성의 조합은 항상 유일성을 만족하기 때문입니다. 이 경우, {학번, 과목코드} 자체가 이 테이블의 복합 기본키가 됩니다.

결론: 데이터 무결성의 초석이자 관계의 시작

지금까지 데이터베이스의 다양한 키의 종류와 그 역할을 살펴보았습니다. 키는 데이터베이스 설계의 가장 기초적이면서도 가장 중요한 개념입니다. 어떤 속성을 키로 선택하고, 테이블 간에 어떤 관계를 맺어줄 것인지를 결정하는 과정이 바로 데이터 모델링의 핵심입니다.

슈퍼키와 후보키를 통해 테이블 내에서 데이터를 유일하게 식별할 수 있는 모든 가능성을 찾아냅니다.
그중 가장 적합한 기본키를 선택하여 개체 무결성을 보장하고, 데이터 접근의 기준점을 마련합니다.
외래키를 사용하여 테이블 간의 논리적 관계를 설정하고, 참조 무결성을 통해 데이터의 일관성을 유지합니다.

효율적이고 안정적인 데이터베이스를 구축하기 위해서는 각 키의 특성을 명확히 이해하고, 설계하려는 시스템의 요구사항에 맞게 적절한 키를 신중하게 선택하고 배치하는 능력이 필수적입니다. 키는 단순히 데이터를 구분하는 식별자를 넘어, 데이터 세상의 질서와 신뢰를 지탱하는 보이지 않는 뼈대와 같습니다. 이 뼈대를 얼마나 튼튼하고 논리적으로 설계하는가에 따라 데이터베이스 시스템 전체의 품질이 좌우된다는 점을 반드시 기억해야 합니다.

[태그:] 데이터베이스키

데이터의 주민등록번호, 키(Key)로 관계와 무결성을 보장하다