[이것이 자바다]2.2 데이터 타입

2018. 1. 8. 23:32

…

모든 변수에는 타입(type: 형(形))이 있으며, 타입에 따라 저장할 수 있는 값의 종류와 범위가 달라진다. 변수를 선언할 때 주어진 타입은 변수를 사용하는 도중에 변경할 수 없다. 따라서 변수를 선언할 때 어떤 타입을 사용할지 충분히 고려해야 한다.

2.2.1 기본(원시: primitive)타입

기본(원시) 타입이란 정수, 실수, 문자, 논리 리터럴을 직접 저장하는 타입을 말한다. 정수 타입에는 byte, char, short, int, long이 있고, 실수 타입에는 float, double이 있다. 그리고 논리 타입에는 boolean이 있다. 다음은 각 기본 타입의 메모리 크기와 저장되는 값의 범위를 보여준다.

갑의 종류	기본 타입	메모리 사용 크기		저장되는 값의 범위
정수	byte	1 byte	8 bit	-2^7 ~ (2^7-1)(-128 ~ 127)
	char	2 byte	16 bit	0 ~ 2^16-1(유니코드: ＼u0000 ~ ＼uFFFF, 0 ~ 65535)
	short	2 byte	16 bit	-2^15 ~ (2^15-1)(-32,768 ~ 32,767)
	int	4 byte	32 bit	-2^31 ~ (2^31-1)(-2,147,483,648 ~ 2,147,483,647)
	long	8 byte	64 bit	-^63 ~ (2^63-1)
실수	float	4 byte	32 bit	(+/-)1.4E-45 ~ (+/-)3.4028235E38
실수	double	8 byte	64 bit	(+/-)4.9E-324 ~ (+/-)1.7976931348623157E308
논리	boolean	1 byte	8 bit	true, false

메모리에는 0과 1을 저장하는 최소 기억 단위인 비트(bit)가 있다. 그리고 8개의 비트를 묶어서 바이트(byte)라고 한다. 기본 타입은 정해진 메모리 사용 크기(바이트 크기)로 값을 저장하는데 바이트 크기가 클수록 표현하는 값의 범위가 크다. 각 타입에 저장되는 값의 범위를 정확히 외울 필요는 없지만, 메모리 사용 크기 정도는 알고 있는 것이 좋다. 정수 타입일 경우 -2^(n-1) ~ 2^(n-1)-1의 값을 저장할 수 있는데, 여기서 n이 메모리 사용 크기(bit 수)이다. 예를 들어 int 타입의 경우 4byte(32bit)이므로 -2^31 ~ 2^31-1의 값의 범위를 갖는다. 실수 타입일 경우 가수가 지수 부분에 사용되는 bit크기에 따라서 값의 범위가 결정된다.

2.2.2 정수 타입(byte, char, short, int, long)

정수 타입에는 모두 다섯 개의 타입이 있으며 저장할 수 있는 값의 범위가 서로 다르다. 메모리 크기순으로 나열하면 다음과 같다.

정수 타입	byte	char	short	int	long
바이트 수	1	2	2	4	8

자바는 기본적으로 정수 연산을 int타입으로 수행한다. 그렇기 때문에 저장하려는 값이 정수 리터럴이라면 특별한 이유가 없는 한 intt 타입 변수에 저장하는 것이 좋다. byte와 short이 int보다는 메모리 사용 크기가 작아서 메모리를 절약할 수는 있지만, 값의 범위가 작은 편이라서 연산 시에 범위를 초과하면 잘못된 결과를 얻기 쉽다.

byte 타입

byte 타입은 색상 정보 및 파일 또는 이미지 등의 이진(바이너리) 데이터를 처리할 때 주로 사용된다. byte 타입은 정수 타입 중에서 가장 작은 범위의 수를 저장하는데, 표현할 수 있는 값의 범위는 -128 ~ 127(-2^7 ~ 2^7-1)이다. 양수가 2^7-1인 이유는 0이 포함되기 때문이다. 만약 -128 ~ 127을 초과하는 값이 byte 타입 변수에 저장될 경우 컴파일 에러("Type mismatch: cannot convert from int to byte)가 발생한다. byte 타입이 왜 -128 ~ 127까지 정수값을 저장하는지 알아보자. byte 타입은 1byte, 즉 8bit 크기를 가지므로 다음과 같이 0과 1이 8개로 구성된 이진수로 표현이 가능한다.

이진수									십진수
최상위 비트
0	1	1	1	1	1	1	1	→	127
0	1	1	1	1	1	1	0	→	126

0	0	0	0	0	0	0	1	→	1
0	0	0	0	0	0	0	0	→	0
1	1	1	1	1	1	1	1	→	-1
1	1	1	1	1	1	1	0	→	-2

1	0	0	0	0	0	0	1	→	-127
1	0	0	0	0	0	0	0	→	-128

최상위 비트(MSB: Most Significat Bit)는 정수값의 부호를 결정한다. 최상위 비트가 0이면 양의 정수, 1이면 음의 정수를 뜻한다. 실제 정수값은 나머지 7개의 bitt로 결정된다. 최상위 비트가 1인 음수의 경우에는 나머지 7개의 bit를 모두 1의 보수(1은 0으로, 0은 1로)로 바꾸고 1을 더한 값에 -를 붙여주면 십진수가 된다. 예를 들어 -2는 다음과 같이 계산된다.

-2의 이진수	→	1	1	1	1	1	1	1	0	1의 보수
십진수 계산 방법			0	0	0	0	0	0	1	1의 보수
								+	1
			0	0	0	0	0	1	0	→	-2
			2^6	2^5	2^4	2^3	2^2	2^1	2^0	→	(1×2^1)

byte 타입보다 크기가 큰 short, int, long 타입도 전체 바이트 수만 다를 뿐 동일한 원리로 정수값을 표현한다.

코드에서 정상적으로 변수에 올바른 값을 저장하더라도 프로그램이 실행하는 도중에 변수의 값은 변경된다. 만약 실행 중에 저장할 수 있는 값의 범위를 초과하면 최소값부터 다시 반복 저장되는데, byte일 경우 -128(최소값)부터 시작해서 127(최대값)을 넘으면 다시 -128부터 시작하게 된다. 또 다른 정수 타입인 short, int, long역시 저정할 수 있는 값의 범위를 넘어서면 이와 같은 방식으로 처리된다. 이와 같이 저장할 수 있는 값의 범위를 초과햇서 값이 저장될 경우 엉터리 값ㅅ이 변수에 저장되는데, 이러한 값을 쓰레기값이라고 한다. 개발자는 쓰레기값이 생기지 않도록 주의해야 한다. 다음 예제는 byte 변수와 int 변수를 각각 125로 초기화하고 5회에 걸쳐 1씩 더하기한 다음 출력한 결과를 보여준다.

byte 변수는 127을 넘어서는 순간 최소값인 -128부터 다시 저장되는 것을 볼 수 있고, int 타입의 변수는 정상적으로 1 증가된 값을 계속 저장하는 것을 볼 수 있다.

char 타입

자바는 모든 문자를 유니코드(Unicode)로 처리한다. 유니코드는 세계 각국의 문자들을 코드값으로 매핑한 국제 표준 규약이다. 유니코드는 하나의 문자에 대해 하나의 코드값을 부여하기 때문에 영문 'A' 및 한글 '가'도 하나의 코드값을 갖는다. 유니코드는 0 ~ 65535 범위의 2byte 크기를 가진 정수값이다. 0 ~ 127까지는 아스키(ASCII) 문자(특수기호 및 영어 알파벳)가 할당되어 있고, 44032 ~ 55203까지는 한글 11172자가 할당되어 있다. 유니코드에 대한 자세한 정보는 유니코드 홈페이지(http://www.unicode.org)에서 찾을 수 있다. 자바는 하나의 유니코드를 저장하기 위해 2byte 크기인 char 타입을 제공한다. 유니코드는 음수가 없기 때문에 char 타입의 변수에는 음수 값을 저장할 수 없다. char 타입에 저장할 수 있는 값은 0 ~ 65535까지 2^16개이다. char 타입 변수에 작은 따옴포(')로 감싼 문자를 대입하면 해당 문자의 유니코드가 저장된다. 예를 들어 'A', 'B', '가', '나' 문자를 char 변수에 저장할 경우 변수에 저장되는 유니코드 값은 다음과 같다.

char var1 = 'A'; //유니코드: 0x0041 → 2진수 : 00000000 01000001

char var2 = 'B'; //유니코드: 0x0042 → 2진수 : 00000000 01000010

char var3 = '가'; //유니코드: 0xAC00 → 2진수 : 10101100 00000000

char var4 = '나'; //유니코드: 0xAC01 → 2진수 : 10101100 00000001

char 변수에 작은 따옴표(')로 감싼 문자가 아니라 직접 유니코드 정수값을 저장할 수도 있다. 특정 문자의 유니코드를 안다면 10진수 또는 16진수로 저장하면 되는데, 예를 들어 문자 A는 10진수로 65이고, 16진수로 0x41이므로 다음과 같이 char 변수에 저장할 수 있다. 16진수로 저장할 경우에는 유니코드라는 의미에서 '＼u + 16진수값' 형태로 값을 저장하면 된다.

char c = 65;

char c = '＼u0041';

프로그램 코드엣서 char 변수에 저장된 유니코드를 알고 싶다면 char 타입 변수를 int 타입 변수에 저장하면 된다.

char c = 'A';

int uniCode = c;

위 예제의 실행 결과를 보면 System.out.println()은 변수의 타입이 char이면 유니코드에 해당하는 문자를 출력하는 것을 볼 수 있다. char 타입 변수는 단 하나의 문자만 저장한다. 만약 문자열을 저장하고 싶다면 String 타입을 사용해야 하는데, 다음과 같이 String 변수를 선언하고, 큰 따옴표(")로 감싼 문자열 리터럴을 대입하면 된다.

String name = "홍길동";

String은 기본 타입이 아니다. String은 클래스 타입이고 String 변수는 참조 변수이다. 문자열을 String 변수에 대입하면 문자열이 변수에 직접 저장되는 것이 아니라, String 객체가 생성되고, String 변수는 String 객체의 번지를 참조하게 된다. char 타입의 변수에 어떤 문자를 대입하지 않고 단순히 초기화를 할 목적으로 다음과 같이 작은 따옴표(') 두 개를 연달아 붙인 빈(empty) 문자를 대입하면 컴파일 에러가 발생한다. 그렇기 때문에 공백(유니코드:32) 하나를 포함해서 초기화해야 한다.

char c = ''; //컴파일 에러 → char c = ' ';

하지만 String 변수는 큰 따옴표(") 두 개를 연달아 붙인 빈 문자를 대입해도 괜찮다.

String str = "";

short 타입

short 타입은 2byte(16bit)로 표현되는 정수값을 저장할 수 있는 데이터 타입이다. 저장할 수 있는 값의 범위는 -32,768 ~ 32,767(-2^15 ~ 2^15-1)이다. C언어와의 호환을 위해 사용되며 비교적 자바에서는 잘 사용되지 않는 타입이다.

int 타입

int 타입은 4byte(32bit)로 표현되는 정수값을 저장할 수 있는 데이터 타입이다. 저장할 수 있는 값의 범위는 -2,147,483,648 ~ 2,147,483,647(-2^31 ~ 2^31-1)이다. int 타입은 자바에서 정수 연산을 하기 위한 기본 타입이다. 쉽게 설명하면 byte 타입 또는 short 타입의 변수를 + 연산하면 int 타입으로 변환된 후 연산되고 연산의 결과 역시 int 타입이 된다. 이것은 자바에서 정수 연산을 4byte로 처리하기 때문이다. 따라서 byte 타입이나 short 타입으로 변수를 선언한 것과 int 타입으로 변수를 선언한 것의 성능 차이는 거의 없다. 정수값을 직접 코드에서 입력할 경우 8진수, 10진수, 16진수로 표현할 수 있다. 8진수일 경우 숫자 앞에 '0'을 붙이면 되고, 16진수는 '0x'를 붙이면 된다. 다음은 10진수 10을 각각 8진수와 16진수로 표현해 변수에 저장한다.

int number = 10;

int octNumber = 012;

int hexNumber = 0xA;

변수에 어떤 진수로 입력을 하더라도 동일한 값이 2진수로 변환되어 저장된다. 10이 int 타입 변수에 저장되면 메모리에 생성되는 변수는 다음과 같다. int가 4byte의 크기를 가지기 때문에 4byte의 공간을 차지하면서 총 32bit로 10을 표현한다.

00000000 00000000 00000000 00001010

1byte 1byte 1byte 1byte

10은 1byte로 충분히 표현이 가능하기 때문에 나머지 상위 3byte의 bit 값은 모두 0이다.

long 타입

long 타입은 8byte(64bit)로 표현되는 정수값을 저장할 수 있는 데이터 타입이다. 저장할 수 있는 값의 범위는 -2^63 ~ 2^63-1이다. 수치가 큰 데이터를 다루는 프로그램에서는 long 타입이 필수적으로 사용된다. 대표적인 예가 은행 및 우주와 관련된 프로그램들이다. long 타입의 변수를 초기화할 때에는 정수값 뒤에 소문자 'l'이나 대문자 'L'을 붙일 수 있다. 이것은 4byte 정수 데이터가 아니라 8byte 정수 데이터임을 컴파일러에게 알려주기 위한 목적이다. int 타입의 저장 범위를 넘어서는 큰 정수는 반드시 소문자 'l'이나 대문자 'L'을 붙여야 한다. 그렇지 않으면 컴파일 에러가 난다. 일반적으로 'l'은 숫자 '1'과 비슷해 혼돈하기 쉬우므로 대문자 'L'을 사용한다.

7라인에서 에러(The literal 1000000000000 of type int is out of range)가 나는 이유는 int 타입의 저장 범위를 넘어서는 정수 리터럴에 'L'을 붙이지 않았기 때문이다.

2.2.3 실수 타입(float, double)

실수 타입은 소수점이 있는 실수 데이터를 저장할 수 있는 타입으로, 메모리 사용 크기에 따라 float과 double이 있다.

실수 타입	float	double
바이트 수	4	8

float과 double의 메모리 사용 크기는 각각 int와 long의 크기와 같지만, 정수 타입과는 다른 저장 방식 때문에 정수 타입보다 훨씬 더 큰 범위의 값을 저장할 수 있다. 실수는 정수와 달리 부동 소수점(floating-point) 방식으로 저장된다. 부동 소수점 방식은 실수를 다음과 같은 형태로 표현한 것을 말한다.

+ m × 10^n

부호 가수(mantissa) 지수(exponent)

가수 m은 0 ≤ m ＜ 1 범위의 실수이어야 한다. 예를 들어 실수 1.2345는 부동 소수점 방식으로 표현하면 0.12345 × 10^1이며, 가수는 0.12345이고 지수는 1이 된다. float 타입과 double 타입은 가수와 지수를 저장하기 위해 전체 bit를 나누어 사용한다. 다음은 float과 double 타입이 전체 bit를 어떻게 사용하는지 그림으로 보여준다.

float : 부호(1bit) + 지수(8bit) + 가수(23bit) = 32bit = 4byte

지수 (8bit)

가수 (23bit)

double : 부호(1bit) + 지수(11bit) + 가수(52bit) = 64bit = 8byte

지수 (11bit)

가수 (52bit)

위 그림에서 가수를 표현하는데 있어서 float에 비해 double이 약 두 배의 자릿수가 배정되어 있다. 따라서 float보다 double이 더 정밀한 값을 저장할 수 있기 때문에 높은 정밀도를 요구하는 계산에서는 double을 사용해야 한다. 자바는 실수 리터럴의 기본 타입을 double로 간주한다. 이 말은 실수 리터럴을 float 타입 변수에 그냥 저장할 수 없다는 뜻이다. 실수 리터럴을 float 타입 변수에 저장하려면 리터럴 뒤에 소문자 'f'나 대문자 'F'를 붙여야 한다.

double var1 = 3.14;

float var2 = 3.14; //컴파일 에러(Type mismatch: cannot convert from double to float)

float var3 = 3.14F;

만약 정수 리터럴에 10의 지수를 나타내는 E또는 e를 포함하고 있으면 정수 타입 변수에 저장할 수 없고 실수 타입 변수에 저장해야 한다. 다음은 정수값 3000000을 저장하는 방법을 보여준다.

int var6 = 3000000; //3000000

double var7 = 3e6; //3000000

float var8 = 3e6f; //3000000

double var9 = 2e-3; //0.002

float과 double의 정밀도를 테스트하기 위해 var4와 var5에 값을 저장하고 출력해보니, double 타입인 var4가 float 타입인 var5보다 두 배 이상 정밀하게 값이 저장되어 있는 것을 볼 수 있다. 이것은 double 탑의 가수 bit 수가 float 타입의 가수 bit 수보다 약 두 배 정도 크기 때문이다.

2.2.4 논리 타입(boolean)

boolean 타입은 1byte(8bit)로 표현되는 논리값(true/false)을 저장할 수 있는 데이터 타입이다. boolean 타입은 두 가지 상태값을 저장할 필요성이 있을 경우에 사용되며, 상태값에 따라 조건문과 제어문의 실행 흐름을 변경하는데 주로 이용된다. 예를 들어 다음 코드를 보면 stop 변수에 true가 저장되어 있기 때문에 if 블록을 실행해서 "중지합니다."가 출력된다. 만약 stop 변수에 false가 저장되어 있다면 else 블록이 실행되어 "시작합니다."를 출력한다. stop 변수에 값을 변경 해보면서 출력 내용을 확인해보길 바란다.

저작자표시 비영리 변경금지 (새창열림)

'언어 > JAVA' 카테고리의 다른 글

[이것이 자바다]3.1 연산자와 연산식 (0)	2018.01.16
[이것이 자바다]2.3 타입 변환 (1)	2018.01.12
[이것이 자바다]2.1 변수 (0)	2018.01.07
[이것이 자바다]1.6 이클립스 설치 (0)	2018.01.04
[이것이 자바다]1.5 주석과 실행문 (0)	2018.01.02

ukss

[이것이 자바다]2.2 데이터 타입

'언어 > JAVA' 카테고리의 다른 글

+ Recent posts

티스토리툴바