본문 바로가기

javascript

Javascript Data Type

Javascript Data Type

데이터 타입은 값의 종류를 말하며, 자바스크립트의 모든 값은 데이터 타입을 가지고 있습니다.
자바스크립트는 ES6 이후 7개의 데이터 타입을 제공하고 원시(primitive)타입 과 객체(object / reference) 타입으로 구분됩니다.

원시(Primitive)타입

  • 블리언(boolean) 타입 - 논리점 참(true) 과 거짓(false)
  • null 타입 - 값이 없다는 것을 의도적으로 명시할 때 사용하는 값
  • undefined 타입 - var 키워드로 선언된 변수에 암묵적으로 할당되는 값
  • 숫자(number) 타입 - 숫자, 정수와 실수 구분 없이 하나의 숫자 타입만 존재
  • 문자열(string) 타입 - 문자열
  • 심볼(Symbol) 타입 (New in ECMAScript 6) - ES6에 추가된 7번쨰 타입

Object - 객체 타입

  • 객체 (Object)
  • 배열 (Array)
  • 함수 (Function)

숫자 타입의 값과 문자열 타입의 값은 같은 1이라 해도 전혀 다른 값이다. 숫자 타입의 값은 주로 산술 연산을 위해 생성하고 문자열은 값은 주로 텍스트를 화면에 출력하기 위해 생성한다.

확보해야 할 메모리 공간의 크기와 메모리에 저장되는 2진수, 읽고 해석하는 방식도 다르다.

자바스크립트는 동적 언어(Dynamically Typed Language)이기 때문에 런타임에 타입이 결정된다. 즉, 소스다 빌드 될때 결정하는 것이 아니라 실행 시 결정 된다.
실행 도중에 변수에 예상치 못한 타입이 들어와 Type Error가 발생하는 경우가 생길 수 있다. Typescript를 사용하면 정적 언어처럼 자바스크립트를 사용 가능하다.

숫자(number) 타입

자바스크립트는 C나 자바의 정수,실수를 다양한 숫자 타입(int, long, float, double 등)으로 제공하는 것과 다르게 하나의 숫자 타입만 존재한다. ECMAScript 사양에 따르면 자바스크립트는 모든 수를 실수로 처리하며, 정수만 표현하기 위한 데이터 타입이 별도로 존재하지 않는다.

var integer = 10; // 정수
var double = 10.12; // 실수
var negative = -20; //음의 정수

자바스크립트의 경우 정수, 실수, 2진수, 8진수, 16진수 리터럴은 모두 메모리에 2진수(배정밀도 64비트 부동소수점 형식)로 저장된다. 그렇기 때문에 2진수, 8진수, 16진수를 표현하기 위한 데이터 타입을 따로 제공하지 않는다. 만약 값을 참조하면 모두 10진수로 해석 된다.

var binary = 0b01000001; // 2진수
var octal = 0o101; // 8진수
var hex = 0x41; // 16진수

// 표기법만 다를 뿐 모두 같은 값
console.log(binary) //65
console.log(octal) //65
console.log(hex) //65
console.log(binary === octal) //true
console.log(octal === hex) //ture

자바스크립트의 숫자 타입은 정수만을 위한 타입이 없고 모든 수를 실수로 처리한다. 사실 정수로 표시 된다해도 실수라는 의미다. 따라서 정수를 표시되는 수끼리 나누더라도 실수가 나올 수 있다.

console.log(1 === 1.0); //true
console.log(4 / 2); //2
console.log(3 / 2); //1.5

숫자 타입은 추가적으로 3가지 특별한 값도 표현할 수 있다.

  • Infinity - 양의 무한대
  • -Infinity - 음의 무한대
  • NaN 산술 연산 불가(not-a-number)
console.log(10/0) //Infinity
console.log(10/-10) //-Infinity
console.log(1 * 'String') //NaN

// NaN 대소문자 구분
var x = nan // ReFerenceError: nan 1s not defined

자바스크립트 대소문자를 구별하므로 NaN을 NaN, Nan, nan과 같이 표현하면 에러가 발생하므로 주의해야 한다.

문자열(string) 타입

문자열은 0개 이상의 16비트 유니코드 문자(UTF-16)의 집합으로 전 세계 대문자의 문자를 표현할 수 있다.

문자열의 표기법은 3가지가 있다.

  • 작은 따옴표('')
  • 큰 따옴표("")
  • 백틱(``)

가장 일반적인 표기법은 작은 따옴표를 사용한다.

문자열을 따옴표로 감싸는 이유는 키워드나 식별자 같은 토큰과 구분하기 위해서다. 만약 문자열을 따옴표로 감싸지 않으면 키워드나 식별자 같은 코드로 인식한다. 만약 따옴표로 감싸지 않는다면 공백 문자도 포함시킬 수 없다.

자바스크립트의 문자열은 C나 자바와 다르게 원시 타입이기 때문에 변경 불가능값(immutable value)이다. 즉, 문자열이 생성되면 그 문자열을 변경할 수 없다는 것을 의미한다.

템플릿 리터럴

템플릿 리터럴은 ES6부터 도입된 새로운 문자열 표기법으며 멀티라인 문자열, 표현식 삽입, 태그드 템플릿 등 편리한 문자열 처리 기능을 가지고 있다. 런타임에 일반 문자열로 변환되어 처리된다.

템플릿 리터럴은 일반 문자열과 다르게 작은 따옴표나 큰 따옴표 말고 백틱을 사용하여 표현한다.

var template = `Template Literal`;
console.log(template); //Template Literal

일반 문자열에서는 줄바꿈 등 공백(whlle space을)을 표현하기 위해선 백슬래시()로 시작하는 이스케이프 시퀀스(escape sequenc)를 사용해야한다.

이스케이프 스퀀스 의미
\0 Null
\b 백스페이스
\f 폼 피드: 프린터로 출력할 경우 다음 페이지의 시작 지점으로 이동한다.
\n 개행: 다음 행으로 이동
\r 개행: 커서를 처음으로 이동
\t 탭(수평)
\v 탭(수직)
\uXXX 유니코드 예) '\u0041' = 'A'
\ ' 작은 따옴표
\ " 큰 따옴표
\ \ 백슬래시

일반 문자열과 달리 템플릿 리터럴 내에서는 이스케이프 시퀀스를 사용하지 않고도 줄바꿈이 허용되고, 모든 공백도 있는 그대로 적용된다.

var template = `<ul>
    <li><a href="#">Home<a/></li>
</ul>`
console.log(template);
/* 출력 결과
<ul>
    <li><a href="#">Home<a/></li>
</ul>
*/

표현식 삽입

피연산자 중 하나 이상이 문자열인 경우 문자열 연결 연산자로 동작한다. 그 외의 경우는 + 연산자로 동작한다.

var first = 'Grotesq';
var last = 'Studio';

console.log(first + ' ' + last); //Grotesq Studio

템플릿 리터럴 내에서는 표현식 삽입을 통해 간단히 문자열 삽입이 가능하고 문자열 연산자 보다 가독성과 편리성에서 더 좋은점이 있다.

var first = 'Grotesq';
var last = 'Studio';

console.log(`나는 ${first} ${last}에서 일을 하고있다.`); 
//나는 Grotesq Studio에서 일을 하고있다.

템플릿 리터럴에서 표현식을 사용하려면 ${} 으로 사용한다. 만약 문자열이 아니더라도 강제로 문자열 타입으로 변환되어 삽인 된다.

불리언 타입

불리언 타입은 논리적 참, 거짓을 나타내는 true 와 false 분이며, 프로그램의 흐름을 제어하는 조건문에서 자주 사용한다.

undefined 타입

undefined 타입의 값은 undefined가 유일하고 var 키워드로 선언한 변수는 암묵적인 undefined로 초기화 된다. 즉 변수 선언에 의한 확보된 메모리 공간을 처음 할당이 이뤄질 때까지 빈 상태로 두지 않고 undefined로 초기화한다.

undefined는 개발자가 의도적으로 할당하기 위한 값이 아닌 자바스크립트 엔진이 변수를 초기화할 때 사용하는 값이다.

null 타입

null 타입도 null이 유일한 값이다. 대소문자를 구별하므로 정확하게 null 이라고 입력 해줘야 한다.

undefined 와는 반대로 값이 없다는 것을 의도적으로 명시할 때 사용한다. 이전에 할당되어 있던 값에 대한 참조를 명시적으로 제거하는 것을 의미하며, 자바스크립트 엔진은 누구도 참조하지 않는 메모리 공간에 대해 가비지 콜렉션을 수행할 것이다.

가비지 컬렉션

심벌 타입

심벌은 ES6에 추가된 7번째 타입으로 심벌 값은 다른 값과 중복 되지 않는 유일무이한 값이다. 따라서 주로 이름이 충돌할 위험이 없는 객체의 유일한 프로퍼티 키를 만들기 위해 사용한다.

다른 원시 값은 리터럴을 통해 생성하지만 심벌은 Symbol 함수를 호출해서 생성한다. 이때 생성된 심벌 값은 외부로 노출되지 않으며, 다른 값과 절대 중복되지 않는 값이다.

var key = Symbol('key');
console.log(typeof key); // symbol

var obj = {};

obj[key] = 'value';
console.log(obj[key]); // value

심볼형

데이터 타입이 필요성

데이터 타입은 왜 필요한 것인가?

데이터 타입에 의한 메모리 공간의 확보와 참조

값은 메모리에 저장하고 참조할 수 있어야한다. 메모리에 값을 저장하려면 먼저 확해보해야 할 메모리 공간의 크기를 결정해야한다. 즉, 몇 바이트의 메모리 공간을 사용해야 낭비와 손실 없이 값을 저장할 수 있는지 알아야 한다.

자바스크립트 엔진은 값의 종류(데이터 타입)에 따라 정해진 크기의 메모리 공간을 확보한다.

값을 저장할때

  1. 자바스크립트 엔진은 타입의 값으로 해석
  2. 타입의 값을 저장하기 위해 메모리 공간 확보
  3. 값을 2진수로 저장

값을 참조할때

  1. 식별자 score를 통해 타입의 값이 저장되어 있는 메모리 공간 주소로 찾아감
  2. 값을 참조하기 위해 한 번에 읽어 들인다.

2번의 경우 값을 한번에 읽어드리지 못하면 값이 훼손된다. 하지만 어떻게 메모리 셀의 크기를 알고 읽어드릴까? 그것은 할당된 타입으로 할 수 있다. 숫자 타입의 경우 8바이트 단위로 저장되므로 자바스크립트 엔진은 저장된 값을 한번에 읽을 수 있게 된다.

데이터 타입에 의한 값의 해석

메모리에서 읽은 2진수의 값을 데이터 타입에 맞게 해석해서 사용한다.

예를 들어 메모리에 저장된 값이 0100 0001의 2진수 값이고 이것을 숫자 타입으로 해석한다면 65고 문자열 타입으로 해석한다면 'A' 이다.

정리

  • 값을 저장할 때 확보해야 하는 메모리 공간의 크기를 결정하기 위해
  • 값을 참조할 때 한 번에 읽어 들여야 할 메모리 공간의 크기를 결정하기 위해
  • 메모리에서 읽어 들인 2진수를 어떻게 해석할지 결정하기 위해

동적 타이핑

위에서도 잠깐 얘기 했듯 자바스크립트는 동적 언어이다. 그렇다면 정적 타입 언어는 어떠할까?

동적 타입 언어와 정적 타입 언어

정적 타입 언어는 변수를 선언할 때 변수에 할당할 수 있는 값의 종류(타입)를 선언해야한다.
이것을 명시적 타입 선언(explicll type declaration)이라고 한다.

동적 타입 언어인 자바스크립트는 변수는 선언이 아닌 할당에 의해 타입이 결정(타입 추론type inference)된다. 그리고 재 할당에 의해 변수의 타입은 언제든지 동적으로 변할 수 있다. 이러한 특징을 동적 타이핑이라고 한다.

정적 타입 언어

  • 컴파일 시간에 변수의 타입이 결정되는 언어
  • 타입 즉, 자료형을 컴파일 시에 결정하는 것
  • C, C++. 자비(Java). 코틀린(Kotlin). 고(Go). 하스켈(Haskell) . 러스트(Rust). 스칼리(scala) 등 대표적인 정적 언어다.
  • 정적 언어는 변수에 들어갈 값의 형태에 따라 자료형을 지정해주어야 한다.
  • 컴파일 시에 자료형에 맞지 않는 값이 들어있을 경우 컴파일 에러가 발생한다.
  • 컴파일 시간에 변수의 타입을 체크하므로 사소한 버그들을 쉽게 체크할 수 있는 장점이 있다.
  • 즉 타입 에러로 인한 문제점을 초기에 발견할 수 있어 타입의 안정성이 올라간다.

동적 타입 언어

  • 런타임에 타입이 결정되는 언어
  • 즉, 소스가 빌드될 때 자료형을 결정하는 것이 아니라 실행 시 결정된다.
  • 매번 타입을 써줄 필요가 없기 때문에 프로그래머 빠르게 코드를 작성할 수 있다.
  • Javascript, Ruby, Python 등은 대표적인 동적 언어다.
  • 런타임까지 타입에 대한 결정을 끌고 갈 수 있기 때문에 선택의 여지가 있다.
  • 실행 도중에 변수에 예상치 못한 타입이 들어와 Type Error가 발생하는 경우가 생길 수 있다.