Data명세서.md 2.36 KB
Newer Older
1
2
3
4
### _데이터 명세서_

<br>

5
# 1. Data Store
6

7
PostgreSQL DB를 이용하여, 날씨 데이터와 분석 결과를 저장합니다.
8

9
<br>
10

11
## Weather_Out
12

13
14
15
16
| Field |   loc_code   | collected_at  |   temp    |   humi    | press | wind_speed |
| :---: | :----------: | :-----------: | :-------: | :-------: | :---: | :--------: |
| Mean  | 지역코드(PK) | 수집 시간(PK) | 실외 온도 | 실외 습도 | 기압  |    풍속    |
| Type  |   INTEGER    |     DATE      |   FLOAT   |   FLOAT   | FLOAT |   FLOAT    |
17

18
<br>
19

20
- 실외 데이터 수집 형식 입니다.
21

22
<br>
23

24
## Weather_In
25

26
27
28
29
| Field |    host    | collected_at  |   temp    |   humi    |     lights      |
| :---: | :--------: | :-----------: | :-------: | :-------: | :-------------: |
| Mean  | 사용자(PK) | 수집 시간(PK) | 실내 온도 | 실내 습도 | 실내 광도(조도) |
| Type  |   STRING   |     DATE      |   FLOAT   |   FLOAT   |      FLOAT      |
30

31
<br>
32

33
- 실내 데이터 수집 형식 입니다.
34

35
<br>
36

37
## Data_Processing
38

39
40
41
42
| Field |    host    |     collected_at     |        params         |
| :---: | :--------: | :------------------: | :-------------------: |
| Mean  | 사용자(PK) | 데이터 분석 날짜(PK) | 데이터 분석 결과 인자 |
| Type  |   STRING   |         DATE         |         JSON          |
43

44
<br>
45

46
47
- 데이터 분석을 진행하고 발생한 인자들을 저장하는 형식입니다.
- 가중치, 편향, 평균, 표준편차가 발생할 수 있고, JSON 형태로 모두 저장합니다.
48
49
50

<br><br>

51
# 2. Data Processing
52
53
54

<br>

55
매일 자정 사용자 개개인의 데이터를 바탕으로 분석과정이 진행됩니다.
56

57
58
59
1. 데이터 전처리 과정
2. 데이터 분석 과정
3. 산출 결과물 저장 과정
60

61
<br>
62

63
## File Format
64

65
데이터 분석용 파일의 형식은 csv이며 내용은 다음과 같습니다.
66

67
68
69
|  Header  |     date     | temp_out  | humi_out  | press | wind_speed |  temp_in  |  humi_in  |
| :------: | :----------: | :-------: | :-------: | :---: | :--------: | :-------: | :-------: |
| Contents | 날짜 및 시각 | 실외 온도 | 실외 습도 | 기압  |    풍속    | 실내 온도 | 실외 습도 |
70

71
<br>
72

73
## Preprocessing
74

75
76
77
1. 사용자 정보(email, loc_code, using_aircon)를 검색합니다.
2. 사용자의 수 만큼 데이터 분석을 반복합니다.
3. 사용자 한명에 대해 날씨 정보를 담은 csv파일을 생성합니다.