기본형과 참조형

기본형

  • 위 이미지에 있는 8개의 종류가 데이터의 가장 기본이 되는 타입으로 기본형이라고 불립니다.

  • 기본형 중 변수 값에 가장 적합한 타입을 선택하여 변수를 선언하시면 됩니다.

  • 기본형 변수는 실제 값을 저장합니다.

  • 기본형은 크게 논리, 문자, 정수, 실수 형으로 분리됩니다.

    • 논리형 : boolean

    • 문자형 : char

    • 정수형 : byte, short, int, long

    • 실수형 : float, double

기본형의 종류와 크기

  • 논리형

    • true/false

    • 조건식과 논리적 계산에 사용됩니다.

  • 문자형

    • 문자를 저장하며 변수 당 하나의 문자만을 저장할 수 있습니다.(여러 개의 문자는 String)

  • 정수형

    • 정수 값을 저장합니다.

    • 주로 int, long 을 사용하며 byte는 이진 데이터를 다루는데 사용합니다.

    • default 타입은 int 입니다.

  • 실수형

    • 실수 값을 저장합니다.

    • default 타입은 double 입니다.

기본형의 표현 범위

표현 범위 이해하기

  • 1bit 에는 0과 1이 들어갈 수 있습니다.

    • 1bit는 0, 1 -> 2개

      2bit는 00, 10, 01, 11 -> 4개를 표현할 수 있습니다.

  • 즉, n비트로 표현할 수 있는 값의 개수는 : 2^n 개 입니다.

    • 8bit = 2^8 : 256개

  • n비트로 표현할 수 있는 부호없는 정수의 범위 : 0 ~ 2^n - 1

    • 8bit : 0 ~ 255

  • n비트로 표현할 수 있는 부호있는 정수의 범위 : -2^(n-1) ~ 2^(n-1) - 1

    • 8bit : -128 ~ 127

  • 이제 위 표에 있는 Range 즉, 표현 범위에 대해 이해할 수 있습니다.

실수형 표현 범위

  • 실수형을 처리할 때 정밀도라는 개념이 등장합니다.

  • 정밀도는 '소수점 몇자리 까지 오차없이 표현할 수 있는가' 를 뜻합니다.

  • S부호 즉, 양수인지 음수인지를 표현합니다.

  • E지수 즉, 2의 지수를 표현합니다.

  • M가수 즉, 소수점 이하를 표현합니다.

  • 위처럼 실수형은 정수형과는 저장방식이 다르기 때문에 오차가 발생합니다.

  • 정밀도가 어떻게 계산되었는지 간단하게 보겠습니다.

    • float의 M 즉, 가수는 23자리인데 정규화를 통해서 24자리까지 표현 가능합니다.

    • 따라서 2^24 까지 표현이 가능한데 2^24는 10^7 < 2^24 < 10^8 임으로 정밀도는 7자리 입니다.

    • 마찬가지의 이유로 double은 15자리 입니다.

  • 또한 실수형은 +-M x 2^E 형태로 저장하기 때문에

    int와 같은 4byte 크기의 float이 int 보다 더 큰 범위의 값을 저장 가능한 것입니다.

메모리에 값이 저장되는 과정

  • 위 이미지 처럼 변수 b에 10진수 3을 저장하면 컴퓨터는 이를 2진수로 변환하여 메모리에 저장합니다.

  • 타입 마다 위처럼 값이 저장되는 형식이 있어서 그 형식에 맞게 변환되어 저장됩니다.

문자가 저장되는 과정

아스키코드 표
  • 컴퓨터는 0과 1 밖에 이해하지 못하는 바보같지만 빠르고 정확한 친구라고 했었습니다.

  • 그래서 우리는 문자를 표현하기 위해 문자와 숫자를 매칭하는 아스키 코드를 만들었습니다.

  • 따라서 위처럼 컴퓨터는 아스키 코드표를 기준으로 매칭하여 문자를 저장합니다.

  • 추가로 문자코드는 음수를 사용할 필요가 없기 때문에 char의 범위에는 부호가 없습니다.

아스키코드

  • 128개의 문자조합을 제공하는 7비트 부호

  • 알파벳, 숫자, 특수기호, 그 외 컴퓨터에 필요한 몇 가지만이 정의

유니코드

  • 각 나라별 언어를 모두 표현하기 위해 나온 코드 체계

  • 문자마다 고유한 코드 값을 제공하는 새로운 개념의 코드

  • 16비트로 표현 - 최대 65,536 자 표현 가능

UTF-8

  • 유니코드를 사용하는 인코딩 방식 중 하나

  • 영문/숫자/기호는 1바이트로, 한글/한자는 3바이트로 표현

  • 전세계 모든 글자들을 한꺼번에 표현 가능

  • 유니코드 한 문자를 나타내기 위해 1바이트에서 4바이트까지 사용

정수형 오버플로우

  • 위 이미지 처럼 정수형은 해당 변수타입의 최솟값, 최댓값 범위를 넘어가면 값을 순환합니다.

  • 아래 예제코드로 학습해 보겠습니다.

    • 아직 배우지 않은 연산자, 형변환 개념이 들어가지만 뒤에서 학습하기 때문에 '값을 순환한다' 만 이해하시면 됩니다.

타입간의 변환방법

문자와 숫자간의 변환

  1. 숫자를 문자로

    • 숫자 + '0' -> 문자

  2. 문자를 숫자로

    • 문자 - '0' -> 숫자

  • 아래 예제코드로 학습해 보겠습니다.

문자열로의 변환

  1. 숫자를 문자열로

    • 숫자 + "" -> 문자열

  2. 문자를 문자열로

    • 문자 + "" -> 문자열

  • 아래 예제코드로 학습해 보겠습니다.

문자열을 숫자, 문자로 변환

  1. 문자열을 숫자로

    • Integer.parseInt("문자열")

    • Double.parseDouble("문자열")

  2. 문자열을 문자로

    • "문자열".charAt(0)

  • 아래 예제코드로 학습해 보겠습니다.

참조형

  • 기본형을 제외한 나머지 타입을 뜻합니다.

    • ex) String, System

  • 참조형 변수는 null 또는 메모리 주소를 저장합니다.

    • null 은 '어떤 객체의 주소도 저장되지 않음' 을 뜻합니다.

    • 타입에 관계없이 변수의 크기가 항상 4byte 입니다. (JVM이 64bit일 경우 8byte)

    • 4byte는 2진수로 대략 40억개로, 40억byte(4GB)의 메모리를 다룰 수 있습니다.

  • 참조형은 앞으로 계속 학습하기 때문에 간단한 예제코드로 확인만 하고 넘어가겠습니다.

Ref. Java의 정석 기초편 Chapter2(10, 11, 15, 16, 17)

Ref. 기본형과 참조형, 기본형 종류와 범위, 오버플로우, 탑입 형변환

Last updated