UDF – dsgnmstr; Design Monster

프로그래밍이나 데이터베이스 작업을 하다 보면, 복잡하지만 반복적으로 수행해야 하는 계산이나 로직을 마주하게 됩니다. 예를 들어, 사용자의 생년월일로부터 현재 나이를 계산하거나, 상품의 원가와 할인율을 적용해 최종 판매가를 구하는 작업은 여러 곳에서 필요할 수 있습니다. 이때마다 매번 동일한 코드를 복사해서 붙여넣는다면 코드는 길어지고, 수정이 필요할 때 모든 곳을 찾아 바꿔야 하는 ‘유지보수의 재앙’이 시작됩니다. ‘사용자 정의 함수(User-Defined Function, UDF)’는 바로 이러한 문제를 해결하기 위해 탄생한 강력한 도구입니다.

사용자 정의 함수는 개발자가 특정 기능을 수행하는 자신만의 함수를 직접 만들어 데이터베이스에 등록하고, SUM(), AVG()와 같은 내장 함수(Built-in Function)처럼 SQL 문 내에서 자유롭게 호출하여 사용하는 기능입니다. 이는 복잡한 로직을 하나의 ‘블랙박스’처럼 캡슐화하여, SQL 쿼리를 훨씬 더 간결하고 직관적으로 만들어 줍니다. 이 글에서는 정보처리기사 시험에서도 다루는 사용자 정의 함수의 개념과 종류, 그리고 현명하게 사용하는 방법에 대해 알아보겠습니다.

사용자 정의 함수의 종류: 목적에 맞는 도구를 선택하라

SQL에서 사용자 정의 함수는 반환하는 값의 형태에 따라 크게 세 가지 유형으로 나눌 수 있습니다. 각 함수의 특징과 용도를 이해하면 상황에 맞는 최적의 함수를 설계할 수 있습니다.

1. 스칼라 함수 (Scalar Function)

스칼라 함수는 가장 기본적이고 흔하게 사용되는 유형으로, 하나의 값(예: 숫자, 문자열, 날짜)을 입력받아 로직을 수행한 뒤 단 하나의 값을 반환하는 함수입니다.

특징: 입력값과 출력값이 일대일로 대응됩니다. SELECT 문의 컬럼 목록이나 WHERE 절의 조건문 등 단일 값이 들어갈 수 있는 대부분의 위치에서 사용할 수 있습니다.
활용 예시:
- 생년월일(DATE)을 입력받아 만나이(INTEGER)를 계산하는 함수.
- 상품의 정가와 할인율(NUMBER)을 입력받아 최종 판매가(NUMBER)를 계산하는 함수.
- 문자열(VARCHAR)을 입력받아 특정 문자를 마스킹 처리하여 반환하는 함수 (예: ‘홍길동’ -> ‘홍*동’).

간단한 예시 (Oracle SQL 기준):

SQL

CREATE OR REPLACE FUNCTION FNC_CALC_AGE (
    V_BIRTH_DATE IN DATE
)
RETURN NUMBER
IS
    V_AGE NUMBER;
BEGIN
    V_AGE := TRUNC((SYSDATE - V_BIRTH_DATE) / 365);
    RETURN V_AGE;
END;
/
-- 함수 사용
SELECT
    EMP_NAME,
    BIRTH_DATE,
    FNC_CALC_AGE(BIRTH_DATE) AS "만나이"
FROM
    EMPLOYEE;

이처럼 FNC_CALC_AGE 함수를 만들어두면, 나이가 필요한 모든 쿼리에서 복잡한 계산식 없이 함수 호출만으로 결과를 얻을 수 있습니다.

2. 인라인 테이블 반환 함수 (Inline Table-Valued Function)

인라인 테이블 반환 함수는 이름에서 알 수 있듯이, 단일 값이 아닌 ‘테이블(결과 집합)’을 반환하는 함수입니다. 함수의 내부는 단일 SELECT 문으로만 구성되어야 하며, BEGIN-END 블록을 사용한 복잡한 로직은 포함할 수 없습니다.

특징: 파라미터를 받아 동적으로 변하는 테이블을 생성하는 데 사용됩니다. 뷰(View)와 유사하지만, 파라미터를 통해 특정 조건에 맞는 결과 집합만 동적으로 필터링할 수 있다는 장점이 있습니다. FROM 절에서 일반 테이블처럼 사용할 수 있습니다.
활용 예시:
- 특정 부서 코드(VARCHAR)를 입력받아 해당 부서에 소속된 직원 목록(TABLE)을 반환하는 함수.
- 특정 연도(NUMBER)를 입력받아 해당 연도의 월별 매출 통계(TABLE)를 반환하는 함수.

간단한 예시 (SQL Server 기준):

SQL

CREATE FUNCTION FNC_GET_DEPT_EMPLOYEES (@DEPT_CODE VARCHAR(10))
RETURNS TABLE
AS
RETURN
(
    SELECT
        EMP_ID,
        EMP_NAME,
        JOB_TITLE
    FROM
        EMPLOYEE
    WHERE
        DEPARTMENT_CODE = @DEPT_CODE
);
GO
-- 함수 사용
SELECT * FROM FNC_GET_DEPT_EMPLOYEES('D1');

이 함수는 D1이라는 부서 코드를 인자로 받아, 마치 D1 부서 직원들만 들어있는 새로운 테이블이 있는 것처럼 사용할 수 있게 해줍니다.

3. 다중 문 테이블 반환 함수 (Multi-Statement Table-Valued Function)

다중 문 테이블 반환 함수 역시 테이블을 반환하지만, 인라인 함수와 달리 내부에 BEGIN-END 블록을 포함할 수 있어 여러 개의 SQL 문을 사용한 복잡한 로직을 구현할 수 있습니다.

특징: 함수 내에서 변수 선언, 조건문(IF), 반복문(WHILE) 등을 사용하여 데이터를 가공한 후, 최종 결과 테이블을 만들어 반환합니다. 인라인 함수보다 훨씬 더 유연하고 복잡한 처리가 가능합니다.
활용 예시:
- 고객 ID를 입력받아, 해당 고객의 주문 내역을 조회하고, 각 주문의 상태에 따라 ‘배송 준비’, ‘배송 중’, ‘배송 완료’ 등의 텍스트를 추가한 후, 최종 결과 테이블을 반환하는 함수.

함수 유형	반환 값	주요 특징	사용 위치
스칼라 함수	단일 값 (Scalar)	가장 일반적인 함수. 로직 처리 후 하나의 값을 반환.	`SELECT`, `WHERE` 등
인라인 테이블 반환	테이블 (Table)	단일 `SELECT` 문으로 구성. 파라미터가 있는 뷰.	`FROM`, `JOIN`
다중 문 테이블 반환	테이블 (Table)	복잡한 로직(`IF`, `WHILE` 등) 포함 가능.	`FROM`, `JOIN`

사용자 정의 함수, 왜 사용해야 할까? (장점)

사용자 정의 함수를 적절히 활용하면 데이터베이스 개발 및 관리의 효율성을 크게 높일 수 있습니다.

1. 모듈화와 코드 재사용성

가장 큰 장점은 반복되는 로직을 하나의 함수로 묶어 ‘모듈화’할 수 있다는 것입니다. 한번 잘 만들어진 함수는 여러 쿼리에서 필요할 때마다 호출하여 재사용할 수 있습니다. 이는 전체 코드의 양을 줄여주고, 개발 속도를 향상시킵니다.

2. SQL 쿼리의 가독성 및 단순성 향상

복잡한 비즈니스 로직이 SQL 쿼리 안에 그대로 노출되면 쿼리가 매우 길고 복잡해져 이해하기 어렵습니다. UDF를 사용하면 이 복잡한 로직을 함수 뒤로 숨길 수 있어, SQL 쿼리는 데이터 조회라는 본연의 목적에만 집중할 수 있게 됩니다. SELECT FNC_CALC_FINAL_PRICE(PRICE, DISCOUNT_RATE) ... 와 같은 코드는 그 자체로 의미가 명확하게 전달됩니다.

3. 유지보수 용이성

만약 나이를 계산하는 정책이 ‘만 나이’에서 ‘한국식 나이’로 변경된다면 어떻게 해야 할까요? UDF를 사용하지 않았다면 나이 계산 로직이 포함된 모든 쿼리를 찾아서 수정해야 합니다. 하지만 FNC_CALC_AGE 함수를 사용했다면, 오직 이 함수 내부의 로직만 한 번 수정하는 것으로 모든 것이 해결됩니다. 이는 유지보수의 시간과 비용을 획기적으로 줄여줍니다.

사용자 정의 함수의 함정: 성능 저하를 조심하라

이처럼 많은 장점에도 불구하고, 사용자 정의 함수는 ‘성능’이라는 측면에서 신중하게 접근해야 하는 양날의 검입니다. 잘못 사용된 UDF는 데이터베이스의 성능을 심각하게 저하시키는 주범이 될 수 있습니다.

성능 저하의 주된 원인

Row-by-Row 처리: SELECT 목록이나 WHERE 절에서 스칼라 함수를 사용하면, 조회되는 데이터 한 건 한 건마다 함수가 반복적으로 호출됩니다. 만약 조회 대상이 100만 건이라면, 함수 역시 100만 번 실행되는 것입니다. 이는 데이터베이스에 상당한 부하를 줍니다.
인덱스 사용 방해: WHERE 절의 조건문에 있는 컬럼에 UDF를 사용하면, 데이터베이스 옵티마이저는 해당 컬럼의 인덱스를 제대로 활용하지 못하는 경우가 많습니다. 예를 들어 WHERE SUBSTR(COLUMN, 1, 4) = '2025' 와 같은 조건은 인덱스를 무력화시켜, 결국 테이블 전체를 스캔(Full Table Scan)하게 만들어 성능을 급격히 떨어뜨립니다.
옵티마이저의 예측 방해: 데이터베이스 옵티마이저는 쿼리 실행 계획을 세울 때 UDF 내부의 복잡성을 정확히 예측하기 어렵습니다. 이로 인해 비효율적인 실행 계획이 수립될 가능성이 높아집니다.

현명한 사용을 위한 가이드

이러한 문제를 피하기 위해, UDF를 사용할 때는 다음과 같은 점을 고려해야 합니다.

대량의 데이터를 처리하는 WHERE 절에서의 사용을 최소화하라: 조건절에서 데이터를 가공해야 한다면, UDF를 사용하는 대신 CASE 문이나 다른 SQL 기본 함수를 활용하거나, 가공된 데이터를 미리 저장해두는 컬럼을 추가하는 방안을 고려하는 것이 좋습니다.
성능이 중요한 쿼리에서는 사용을 재고하라: 수 초 내에 응답해야 하는 OLTP(온라인 트랜잭션 처리) 환경에서는 UDF, 특히 스칼라 함수의 남용은 치명적일 수 있습니다.
테이블 반환 함수를 적극적으로 활용하라: 스칼라 함수를 반복적으로 호출하는 대신, 필요한 데이터를 한 번에 가공하여 반환하는 테이블 반환 함수를 JOIN하여 사용하는 것이 성능 면에서 훨씬 유리할 수 있습니다.

결론: 코드의 예술성과 시스템의 성능 사이의 균형

사용자 정의 함수(UDF)는 복잡한 로직을 캡슐화하고 코드를 재사용하여 SQL을 훨씬 더 깔끔하고 유지보수하기 좋게 만들어주는 매우 우아하고 강력한 도구입니다. 개발의 생산성과 코드의 가독성을 높여준다는 점에서 그 가치는 분명합니다.

하지만 그 편리함 이면에는 성능 저하라는 잠재적 위험이 도사리고 있음을 항상 인지해야 합니다. UDF는 ‘만병통치약’이 아니며, 특히 대용량 데이터를 처리하는 환경에서는 그 영향력을 신중하게 평가해야 합니다. 개발자는 코드의 예술성과 시스템의 성능 사이에서 현명한 줄다리기를 해야 합니다. UDF의 장점을 최대한 살리되, 성능에 미치는 영향을 최소화할 수 있는 지점을 찾아 적용하는 능력이 바로 숙련된 데이터베이스 전문가의 역량일 것입니다.

[태그:] UDF

나만의 함수를 창조하다, SQL 사용자 정의 함수(UDF) 활용법