ML week2.2
2025.03.13 Thu PM 1:04 ・ 64Minutes 22seconds
ZHANG YIWEN
ML 第 2.2 周 2025.03.13 周四 下午 1:04 ・ 64 分钟 22 秒 张一文
Attendees 1 00:00
그래비즈 라이브러리 사용한다고 설치 부탁드린다고 올렸었는데 혹시 확인하셨을까요?
네 안 하셔도 이제 사이클렌이랑 브레이즈는 저희 진행할 때 설치하셔도 되니까 만약에 설치 안 되시면은 조교분들한테 말씀해 주시면 감사하겠습니다.
그리고 출석 체크 에도 코드 있으니까 하시면 되고요.
오늘은 이제 이번 수업 시간에 배웠던 런파이랑 캔더스랑 레프리 그리고 사이클론에 대해서 실습을 진행을 하겠
参会人员 1 00:00 关于安装我之前提到的使用重力库,不知道您是否已经确认?好的,即使您没有安装,我们在进行时可以安装 scikit-learn 和 breeze,如果没有安装的话,请告诉助教。另外,出勤签到也有代码,可以直接操作。今天我们将进行上节课学习的 NumPy、Pandas、Seaborn 以及 scikit-learn 的实践
Attendees 1 00:33
공지는 저번이랑 동일하고요. 오늘 수업 시간 내에 제출하시면 또 플러스 점수 있고 그리고 진짜 최종 제출일은 이제 토요일 자정까지 제출해 주시면 됩니다.
그러면 런 파이부터 간단하게 설명 시작하겠습니다.
이제 넘 파일을 할 때 이제 처음으로는 이제 배열을 생성하는 걸 한번 해볼 건데 여기서 이 부분을 실행시켜 주셔야 되는 게 해당 코드를 사용하면은 이제 셀 내부의 모든 실행 결과를 출력하도록 할 수가 있어요.
이게 이제 주피터 노트북의 기본 설정은 여러 개의 가 실행이 되면은 가장 마지막 부분만 출력이 되도록 하는 형태인데 이제 해당 코드를 실행하게 되면은 셀 안에 이제 여러 결과가 있을 때 다 순서대로 출력이 가능합니다.
그래서 요거 실행을 해 주시면 되고요. 그다음에 저희가 이제 넘 파이
与会者 1 00:33 通知与上次相同。如果在今天的课程时间内提交,还可以获得额外分数,最终提交截止日期是周六午夜之前。那么,我们将从 Run Python 开始简单地进行说明。在使用 NumPy 时,首先我们将尝试创建数组。在这里,您需要执行这部分代码,这样可以输出单元格内的所有执行结果。Jupyter Notebook 的默认设置是只输出最后一部分的执行结果,但执行该代码后,可以按顺序输出单元格中的多个结果。所以请执行这个代码,然后我们将继续 NumPy
Attendees 1 01:32
이제 넘 파일을 NP로 불러올 거예요. 그리고 나서 이제 다음과 같은 2차원 형태의 어레이 배열을 생성을 해볼 겁니다.
与会者 1 01:32 现在我们将使用 NP 导入 NumPy,然后创建一个二维数组
Attendees 1 01:48
함수는 거리 함수 보시면
听众 1 01:48 查看距离函数
Attendees 1 02:05
두 개의 리스트가 같이 있는 형태로 되죠 이거를 실행을 해 주시면은 이제 a가 출력이 됩니다.
여기 위에 있는 거랑 동일한 형태로 저희가 생성을 했죠 그다음에 이제 이 생선한 어레이를 가지고 저희가 이제 차온이랑 쉐입에 대해서 확인을 해볼 거예요.
만약에 저희가 생성한 이제 어레이에 디멘션을 확인을 하고 싶다.
그러면 간단하게 이 김을 활용을 하면 됩니다. 저희가 생성했던 어레이가 a니까 a의 m 확인을 해보면 2가 나오겠죠 얘는 지금 2차원 상태니까 그대로 이가 출력이 되는 그리고 그다음에 셰입을 확인하고 싶으면 비슷하게 셰입을 같이 적어주면 돼요.
그러면 저희가 아까 만들었던 a에 쉐입을 하면 컴마선이 되겠죠
听众 1 02:05 这两个列表是以这种形式存在的,如果您执行它,a 就会被输出。我们以与上面相同的方式创建了它,然后我们将使用这个创建的数组来检查维度和形状。如果您想确认我们创建的数组的维度,那么只需简单地使用长度即可。由于我们创建的数组是 a,所以检查 a 的 m 会得到 2,因为它现在是二维的,因此这个值会被输出。接下来,如果您想确认形状,只需以类似的方式写入形状即可。那么对于我们之前创建的 a,形状将是逗号分隔的
Attendees 1 03:10
그다음에 이제 원파이에 다른 함수를 사용을 해볼 건데 어레인지랑 위셰이프가 있어요.
이제 어레인지를 사용을 하게 되면은
接下来,我将使用 NumPy 的其他函数,包括 arrange 和 reshape。当我使用 arrange 时
Attendees 1 03:25
뒤에 안 들리나요? 잠시만요.
后面听不到吗?请稍等。
Attendees 1 03:50
이렇게 하게 되면은 이제 0부터 5까지의 연소를 갖는 얼레이를 만들 수가 있어요.
파이선은 0부터 시작하니까 저희가 6을 지정을 하면 0부터 5까지 총 6개가 지정이 되겠죠
如果这样做的话,现在就可以创建一个从 0 到 5 的数组。因为 Python 从 0 开始,所以当我们指定 6 时,将会得到从 0 到 5 共 6 个元素。
Attendees 1 04:10
네 그다음에는 동일하게 이제 위 어레인지랑 이제 위셰이을 사용을 해서 이제 다 차원 넘파이 어레이를 만들어 볼 건데 이거는 두 개의 연산자를 같이 사용을 하면 됩니다.
저희가 아까 앞에서 이제 어레인지를 사용을 해서 a에다가 0부터 5까지 가지고 있는 일이 만들었잖아요 근데 요거를 이제 위제을 사용을 해서 저희가 원하는 형태의 2차원 o로 변경을 해줄 겁니다.
好的,接下来我们将使用之前的 arrange 和 reshape 来创建多维 NumPy 数组。我们可以同时使用这两个运算符。我们之前已经使用 arrange 创建了一个从 0 到 5 的数组 a,现在我们将使用 reshape 将其转换成我们想要的 2 维形状。
Attendees 1 04:43
컴마 3이 있죠 이렇게 하면은 아까 1차원 a가 2차원으로 변경된 걸 확인할 수가 있습니다.
与会者 1 04:43 有 3 个逗号,如果这样做,您可以确认之前的一维数组 a 已变成二维数组。
Attendees 1 05:02
그리고 이제 다음과 같은 두 개의 또 함수를 사용을 할 건데 일단은 이제 이 제로스를 사용을 하게 되면은 모든 배열의 요소가 0인 머리를 만들 수도 있어요.
근데 저희가 원하는 거는 지금 3 바이 사에 3바이 4인 2차원 넘파이 어레이를 만들고 싶으니까
与会者 1 05:02 接下来我将使用以下两个函数。首先,如果使用 zeros 函数,您可以创建一个所有元素都为 0 的数组。现在,我们想创建一个 3x4 的二维 NumPy 数组。
Attendees 1 05:28
베이터를 설정을 하면 되겠죠 이렇게 해서 실행을 해보면 3바이 사이 2차원 어레이가 이제 모두 0을 가지고 있는 걸 확인을 할 수가 있어요.
如果设置了 1 号出席人员 05:28,运行后,您可以确认现在有一个 3 乘 2 维的数组,其中所有元素都是 0。
Attendees 1 05:46
방금 저희가 이제 한 거는 3 바이 사이 2천 원이고 만약에 3000원을 만들고 싶다.
그러면 2 콤마 3 콤마 4를 사용을 하게 되면 되는데 아까 앞에서는 저희가 제로스를 사용을 해서 모든 요소가 0을 가지고 있는 오이를 만들었죠 근데 이제 원스를 사용을 하게 되면은 모든 요소가 1인 어레이를 만들 수가 있습니다.
그러면 유사하게
我们刚才做的是 3 乘 2 的数组,如果想要创建 3000 元的数组,那么可以使用 2, 3, 4。与之前我们使用 zeros 创建所有元素为 0 的数组不同,如果使用 ones,就可以创建所有元素为 1 的数组。那么类似地...
Attendees 1 06:14
이렇게 해서 실행을 하게 되면은 2 바이 3바이 4인 3차원의 원파이어를 만들 수가 있습니다.
如果这样执行的话,就可以创建一个 2 乘 3 乘 4 的三维 NumPy 数组。
Attendees 1 06:31
그리고 이제 아이덴티티 함수를 사용해서 만들어 볼 건데 아이덴티티 매트릭스 같은 경우에는 이제 정방 행렬이고 정박 행렬 중에 이 주 백악선의 모든 원소가 1이고 나머지 원소는 0인 그리고 다음과 같은 형태의 매트릭스를 말합니다.
그래서 저희가 이제 아이덴티티를 활용을 하면은 이것과 같은 형태의 어레이를 만들 수가 있는데 저희가 원하는 건 3 바이 3이니까 3을 입력해 주면 되겠죠 이렇게 해서 실행을 해 주시면 만약에 여기에 사로 바꾸면 사 바이 사바 나겠죠
接下来我们将使用恒等函数来创建,对于恒等矩阵,它是一个方阵,主对角线上的所有元素都是 1,其他元素都是 0,形式如下。所以如果我们利用恒等函数,就可以创建这样的数组,因为我们想要的是 3 乘 3 的矩阵,所以只需输入 3 即可。这样执行后,如果将其改为 4 乘 4,就会变成 4 乘 4 矩阵。
Attendees 1 07:14
그다음에 이제 랜덤 함수에 대해서 볼 건데 만약에 저희가 이제 3 바이 3의 행렬을 만들 거예요.
근데 이제 0부터 이제 1까지의 난수를 가진 그런 산발한 매트리스를 만들 건데 여기서 보시면 이제 MP 랜덤 랜드를 사용을 해서 만들 수가 있습니다.
接下来我们将看看随机函数。假设我们要创建一个 3 乘 3 的矩阵,其中包含从 0 到 1 的随机数。在这里,我们可以使用 MP 随机兰德来实现。
Attendees 1 07:45
이렇게 해서 실행한 결과를 보시면 지금 이 함수 같은 경우에는 아까 말씀드렸다시피 0 이상 1 미만 인 이제 난수들의 확률이 모두 동일한 이제 유니폼 디스트리뷰션이죠 그거 그 분포에서부터 난수를 가져와가지고 이제 3발 이상 행렬을 채운다고 생각을 해 주시면 됩니다.
그럼 얘랑 유사하지만 조금 다른 함수를 사용을 해볼 건데요.
이번에 여기에 보시면 아까 위에서는 0부터 1까지였으니까 마이너스가 있는데 아래는 마이너스가 있죠 얘 같은 경우에는 이제
执行结果显示,这个函数正如我之前提到的,产生的随机数概率均匀分布在 0 到 1 之间。这是一个均匀分布,从中获取随机数并填充 3×3 的矩阵。现在我们将使用一个类似但又稍有不同的函数。在之前的例子中,范围是从 0 到 1,而这个函数则包含负数。
Attendees 1 08:29
이거를 사용을 할 건데 이 함수를 실행하게 되면은 이제 여기 보시면 설명이 되어 있죠 0부터 각 원소를 이제 평균이 0이고 군산이 1인 이제 표준 정규 분포로부터 난수를 얻어가지고 이 3발 3 행렬에 넣어준 게 됩니다.
그래서 시행을 하시면 이렇게 나옵니다. 요거는 이제 난수니까 그 아웃풋이 저희가 드린 기본 코드의 아웃풋이랑 조금씩 다를 수가 있어요.
그래서 이건 상관 안 하셔도 됩니다. 그다음에 이제 어레이 연산자에 대해서 알아볼 건데 총 세 가지의 연산자를 실행을 해볼 거예요.
그래서 이제 첫 번째로 저희가 이제 ray a랑 b를 정의를 합니다.
그거는 저희가 제공을 해드렸죠 그래서 일단 첫 번째로 스칼러 곱셈에 대해서 확인을 해볼 건데 지금 보시면 스컬러 값 10을 핵렬 a에 곱해준다고 되어 있습니다.
그럼 그냥 간단하게 a에다가 10을 곱해주면 됩니다.
그래서 실행을 하게 되면은 여기 보시면 원래a는 이제 1이 3 개가 있고 0이 하나 있었는데
参与者 1 08:29 我们将使用这个函数,当执行这个函数时,正如您在这里看到的说明,从 0 开始,每个元素现在都是均值为 0,方差为 1 的标准正态分布的随机数。然后将这些放入 3x3 矩阵中。执行后会出现这样的结果。由于这是随机数,输出可能会与我们提供的基本代码的输出略有不同。所以您不必担心。接下来,我们将了解数组运算符,我们将执行总共三种运算符。首先,我们定义了数组 a 和 b,这是我们提供的。我们首先要确认标量乘法,现在您可以看到将标量值 10 乘以矩阵 a。只需将 10 乘以 a 即可。执行后,您会看到原来的 a 有 3 个 1 和 1 个 0
Attendees 1 09:51
이 각 위치에 10을 곱해주니까 다음과 같은 이를 가지게 됩니다.
그다음에 이제 두 번째 같은 경우에는 이제 엘레멘트 와이저 지션이니까 두 행렬에 같은 위치에 있는 원소객이 더하는 걸 해볼 거예요.
그래서 보시면 이제 a랑 b 핵렬 a랑 b를 원소별로 더하는 거죠.
여기서 보시면 지금 같은 위치에 있는 걸 더하면 1이랑 2를 더하면 3이 될 거고 1이랑 0을 더하면 1이 될 거고 0이랑 3을 더하면 3 그리고 1이랑 4를 더하면 5가 되겠죠 그리고 실행을 해보면 제가 말씀드린 거 동의하게 다음과 같은 2차용 어이가 나옵니다.
参与者 1 09:51 在每个位置乘以 10 后,得到如下结果。接下来,对于第二种情况,我们将进行逐元素相加,即对两个矩阵在相同位置的元素进行相加。您可以看到我们对数组 a 和 b 逐元素相加。在这里,如果在相同位置相加,1 和 2 相加会得到 3,1 和 0 相加会得到 1,0 和 3 相加会得到 3,1 和 4 相加会得到 5。执行后,会得到与我们刚才描述的一致的二维数组。
Attendees 1 10:43
이제 마지막으로 이제 엘리멘트 와이즈 프로덕트인데 요거는 행렬 a랑 b를 이제 원소별로 곱해준다고 생각을 해 주시면 됩니다.
아까 위에서 이제 플러스 기호를 사용했을 때는 각 위치에 있는 걸 더해줬죠 그런데 이거는 각 위치에 있는 걸 곱해준다고 생각을 해 주시면 됩니다.
이고 실행을 하게 되면은 다음과 같은 형태가 나오죠 위에서 보면 이제 1이랑 2를 곱하면 2고 이제 0이랑 3을 곱하면 0이니까 이것들이 반영이 돼서 다음과 같은 결과를 출력하는 걸 볼 수가 있습니다.
그래서 그 기운을 이렇게 작성을 하면 되고 점심은 나가
与会者 1 10:43 现在最后一个是元素智慧乘积,你可以认为是矩阵 a 和 b 逐元素相乘。之前使用加号时是将各个位置的元素相加,但这里是将各个位置的元素相乘。当执行时,结果如下所示:从上面可以看到,1 乘 2 得 2,0 乘 3 得 0,因此会得到如下结果。所以可以这样编写,午餐我要出去了
Attendees 1 11:32
그다음에 이제 행렬 곱셈이랑 행렬 전치를 확인을 해볼 건데 이제 다 메소드를 사용을 하면은 행렬 급샘을 수용할 수가 있어요.
그래서 지금 a 를 하게 되면은
与会者 1 11:32 接下来我们将验证矩阵乘法和矩阵转置,现在可以使用所有方法来处理矩阵。所以当我们对 a 进行操作时
Attendees 1 11:57
그리고 저희가 이제 앱 연산자를 활용을 하면은 이 메소드를 활용한 거랑 동일한 결과를 볼 수가 있습니다.
편하신가요? 사용하면 동일한 결과가 나오죠
然后如果我们使用数组运算符,我们可以看到与使用该方法相同的结果。 感觉方便吗? 使用时会得到相同的结果。
Attendees 1 12:11
그다음에 이 트랜스포즈를 사용을 하면은 a를 전치한 결과를 볼 수가 있습니다.
지금 위에서 보시면 원래 a가 어떻게 생겼었죠? 이렇게 생겼었죠 그리고 이걸 전치하게 되면은 다음과 같은 결과를 확인할 수가 있습니다.
接下来,如果使用转置,我们可以看到 a 的转置结果。现在从上面我们可以看到 a 原来是什么样子? 它是这样的。 当我们进行转置时,可以确认如下结果。
Attendees 1 12:36
래서 간단하게 이제 담배소를 사용하거나 앱을 사용을 하면 해리 업체을 수행을 할 수가 있고 그리고 콤마 티를 사용을 하면은 이제 전치를 할 수가 있습니다.
与会者 1 12:36 因此,现在如果使用烟草所或应用程序,可以执行海里业务,并且如果使用逗号茶,现在可以进行前置了。
Attendees 1 12:54
그다음에 이제 인덱싱이랑 슬라이싱에 대해서 학습을 해볼 건데 일단 이 함수를 이제 시행을 하게 되면은 일단 0부터 19까지의 요소를 어레이로 가진 이제 1차원 어레이가 한 번 생성이 되고 그거를 이제 4바이오로 리셰이을 하니까 총 4 다음과 같은 형태의 2차원 어레이를 만들 수가 있겠죠 얘는 그냥 실행을 하시면 되고요.
与会者 1 12:54 接下来,我将学习索引和切片。如果执行这个函数,首先会生成一个包含 0 到 19 元素的一维数组,然后将其重塑为 4 行,这样就可以创建一个 2 维数组。你只需直接执行即可。
Attendees 1 13:28
그리고 여기서 보시면 이제 배열 a에서 이제 인덱스 인덱스 2에 위치한 요소를 가져온다.
이렇게 되어 있죠 그러면 이제 배열 a에서 세 번째 행에 세 번째 열에 위치한 요소를 가져오게 됩니다.
여기서 그냥 살펴보시면 12를 가져오는 형태가 되겠죠 그래서 이렇게 뭔가를 실행을 하게 되면은 여기에서 12니까 12가 출력이 됩니다.
出席人员 1 13:28 从这里你可以看到,现在从数组 a 中获取索引 2 位置的元素。就是这样。那么现在从数组 a 中获取第三行第三列的元素。从这里你可以看到,我们获取的是 12。所以当我们执行这个操作时,由于是 12,所以会输出 12。
Attendees 1 14:12
이 첫 번째 두 개의 행 그리고 첫 번째 두 개의 열에 해당하는 부분을 슬라이싱 해 볼 건데 간단하게 이렇게 작성을 해주면 됩니다.
出席人员 1 14:12 我们将对第一个两行和第一个两列进行切片。简单地这样编写就可以了。
Attendees 1 14:26
이렇게 해주시면은 이제 0 컬러니 같은 경우에는 이제 0부터 1까지죠 그래서 처음에 이제 두 줄과 그리고 또 여기도 동일하게 0 클럼이니까 여기서 두 줄 이렇게 이바이의 어레이를 가져오게 되는 거예요.
실행을 해볼게요. 그러면 제가 말씀드린 대로 이런 형태의 어리를 가져오게 되는 걸 확인할 수가 있습니다.
与会者 1 14:26 如果您这样做的话,现在 0 列嘛,在这种情况下是从 0 到 1,所以一开始就是两行,然后这里也同样是 0 列,所以在这里也是两行,这样就可以获得这个数组。我们来执行一下。那么正如我所说的,您可以确认获得了这种形式的数组。
Attendees 1 14:57
그다음에 이제 첫 번째 이제 첫 두 개의 행을 가져오는 거죠.
그렇게 되면은 이제 행 자리에는 연골로 일을 하고 여기에서 이제 따로 콜을 칼럼을 이제 지정해주지 않았으니까 그냥 콜럼을 작성을 하게 되면은 이게 전체 열을 가져온다는 의미가 되거든요.
그러면 이걸 실행을 해보면 이렇게 나오겠죠 이거는 어디냐면 여기에서 보시면 이제 첫 번째 두 개의 행을 가져오고 열은 전체를 지정해 주기 때문에 바이오의 어레이가 가져와 됩니다.
이 부분만 가져오게 됩니다. 이번엔 반대로 이제 첫 번째 두 개의 열만 가져오는 거죠.
그러면 행 자리는 전체를 지정을 해야 되니까 토론을 작성을 해주고 0부터 6까지 이렇게 실행을 하면 되겠죠 저에 아빠랑 가면 되고 이제 이렇게 는 걸 확인할 수가
与会者 1 14:57 接下来,现在是获取前两行。这样的话,在行的位置上进行操作,并且在这里没有特别指定列,所以如果直接写列的话,意味着获取所有列。那么执行后会是这样的,如果您看这里,就是获取了前两行,并且指定了整列,所以可以获取 Bio 的数组。只会获取这一部分。现在相反地,就是只获取前两列。那么行的位置就需要指定全部,所以写入讨论,从 0 到 6,这样执行就可以了,我的爸爸会去,然后就可以像这样确认了。
Attendees 1 16:21
그다음에는 이제 스태킹에 대해서 확인을 해볼 건데 스택에는 이제 두 가지 방법이 있죠 수평으로 붙이거나 수직으로 붙이거나.
그래서 여기서도 처음에 이제 2차원의 어를 생성을 해주고 이제 다음 코드는 뭐냐면 어 아까 이제 MP 랜더 랜이 이 함수를 사용을 하게 되면은 각 원소를 이제 0 이상 1 미만인 이제 유니폼 디스트리뷰션에서 난수를 가져온다고 말씀을 드렸잖아요.
근데 여기 앞에 이제 10을 곱해주니까 그렇게 되면 이제 0에서 10 미만의 난수를 가져오는 배열이 가져와서 이제 22의 배열을 생성하게 되는 거죠.
그래서 이걸 실행을 해 두면 a는 위에서 정리한 대로 나오고 이제 어레이는 이렇게 나옵니다.
이는 이렇게 나오죠 이 사람마다 달라가지고 꼭 이제 저희가 드렸던 기분 코드에 있는 아웃풋이랑 조금 달라도 상관이 없습니다.
그래서 이제 브이스펙이랑 h 스펙을 실습을 해볼 건데 이제 보다시피 브이스펙에서 v 같은 경우에는 이제 버티컬이니까
接下来我们将确认堆叠的内容,堆叠有两种方法:水平堆叠或垂直堆叠。在这里,首先创建二维数组,下一段代码是什么呢?就是刚才提到的 MP 随机函数,如果使用这个函数,就会从 0 到 1 之间的均匀分布中获取随机数。但是在前面乘以 10,这样就会得到 0 到 10 之间的随机数数组,生成一个 2x2 的数组。执行后,a 会按照之前整理的方式出现,数组也会这样出现。这对于每个人可能会有所不同,不必与我们之前给出的示例代码输出完全一致。接下来我们将实践 vspec 和 hspec,正如你所看到的,在 vspec 中,v 表示垂直方向
Attendees 1 17:38
laa랑 b를 수직 방향으로 붙이게 되는 거죠. 그래서 이
将 a 和 b 在垂直方向上连接起来。所以这
Attendees 1 17:48
이렇게 하시면 이렇게 수직 방향으로 붙는 걸 확인할 수가 있습니다.
如果这样做,你可以看到它们是垂直方向上粘在一起的。
Attendees 1 18:02
그리고 이제 h 스텝 같은 경우에는 프레전트 스텝이니까 a랑 b를 수평 방향으로 붙이겠죠 동일하게 MP를 하고 이번에는 v 스텝이 아니고 LG 스텝을 해서 붙여주면 됩니다.
现在对于 h 步骤,因为是当前步骤,所以会将 a 和 b 水平方向上粘在一起,同样地进行 MP 操作,这次不是 v 步骤,而是 LG 步骤,然后粘在一起。
Attendees 1 18:18
이렇게 해서 실행을 해주면 아까 이거는 v 스텝 아웃풋이고 이거는 h 스텝 아웃풋이 되겠죠
参会者 1 18:18 这样执行的话,这个就是 v 步骤的输出,这个就是 h 步骤的输出
Attendees 1 18:34
그다음에 이제 엑스 축이죠 이제 NN의 형태를 가진 이제 어레이가 있을 e스를 0으로 하게 되면은 이제 행 방향이고 1로 하게 되면은 열 방향을 의미하게 됩니다.
요거는 저희가 아까 많이 봤죠 어레인지 이제 변수를 6으로 설정을 하면 0부터 5까지의 요소를 가지고 있고 이걸 2바이 3인 어레이로 다시 테입을 만들어줘야 되죠.
그래서 a는 다음과 같은 형태가 나오고요. 그리고 이제 서스가 0이 그러니까 축을 0으로 설정을 해가지고 더해주는 걸 실습을 해볼 거예요.
그렇게 되면 행방향으로 더해주겠죠 그래서 이거를 확인을 해보면 이렇게 생방향으로 더하는 걸 확인할 수가 있어요.
0이랑 3을 더하니까 3이 나오고 1이랑 4을 더하니까 5가 나오겠죠
参会者 1 18:34 接下来就是 x 轴,现在有一个 NN 形式的数组,如果 e 为 0,就是行方向,如果为 1,就是列方向。这个我们之前已经见过很多次了,把变量设置为 6,就会有 0 到 5 的元素,然后需要将其转换为 2x3 的数组。因此 a 会呈现这样的形式。然后我们将轴设置为 0,进行相加。这样的话就会按行方向相加。当我们确认时,可以看到是按行方向相加。0 和 3 相加得到 3,1 和 4 相加得到 5
Attendees 1 19:35
그다음에 이번엔 반대로 축을 1로 지정을 하게 되면은 열 방향으로 보여주겠죠 동일하게 해주시면 됩니다.
이렇게 해서 실행을 해 주시면 이런 결과가 나옵니다.
接下来,如果我们将轴设置为 1,就会按列方向显示。以相同的方式执行,就会得到这样的结果。
Attendees 1 20:18
만약에 이제 이 축을 정하지 않고 그냥 썸을 해주면 이거는 안 따르치셔도 돼요.
그냥 전체 어레이를 다 더한 값이 이렇게 나오겠죠
如果现在不指定这个轴,直接求和,你不必遵循这个,只是会得到整个数组的总和。
Attendees 1 20:40
그다음에 이제 정렬을 볼 건데 정열에서도 저희가 축을 지정을 하게 되면 원하는 축 방향으로 정렬을 할 수가 있습니다.
그래서 이번에는 이제 이바이의 어레이를 만들죠.
그러면 a는 다음과 같은 형태로 나오고요. 그다음에 이제 축 방향을 0으로 지정을 해서 정렬을 하게 되면은 행 방향으로 이제 정렬이 된 걸 확인이 가능합니다.
해보면 똑같이 이제 소트인데 여기에 묶어 있겠죠 스 0을 지정을 하게 되면은 지금 여기서 보시면 행방향으로 이제 2가 먼저 나오고 2가 작으니까 그리고 얘는 1방향 1이 작으니까 이제 위로 간 걸 확인할 수가 있습니다.
接下来要看排序,如果我们指定轴,就可以按照所需的轴方向进行排序。那么现在创建一个 NumPy 数组。a 会以这种形式出现。然后如果将轴方向指定为 0 并进行排序,就可以确认按行方向排序。如果这样做,排序时指定轴为 0,从现在的视图可以看到,行方向上先出现 2,因为 2 较小,然后是 1 方向的 1 也较小,所以可以看到向上移动。
Attendees 1 21:36
그다음에 이제 축을 1로 지정을 하게 되면은 열 방향으로 정리를 하겠죠 위랑 동일하게 작성을 해주는데 이제 축만 1로 변경을 해 주면 됩니다.
이렇게 해서 실행을 해 주시면은
接下来,如果将轴指定为 1,就会按列方向进行排序。与之前相同的方式编写,只需将轴更改为 1 即可。这样执行的话
Attendees 1 21:55
너네는 2가 죽 방향으로 정렬이 됐으니까 2가 먼저 나오고 그다음에 20이었는데 이번에는 이제 열 방향으로 정렬이니까 20보다 10이 크니까 10이 앞으로 나오고 2보다 1이 크니까 1이 앞으로 나오겠죠 이렇게 된 걸 확인할 수가 있습니다.
参会者 1 21:55 因为你们已经按照 2 的方向排列,所以 2 先出现,然后是 20。这次是按照列方向排列,所以 10 比 20 大,10 就会在前面,1 比 2 大,所以 1 会在前面。这样的变化你们可以确认。
Attendees 1 22:43
그다음에 이제 기본 통계에 대해서 볼 건데 일단 다들 알다시피 맥스랑 민이 뭐를 의미하는지는 알고 있죠 그래서 일단 여기에서도 이제 1, 2, 3, 4를 요소로 가진 투바이 2 어레이를 만들어주고 이 행렬에서 이제 가장 큰 값을 뽑고 싶으면 이제 x를 사용을 하면 되고 가장 작은 값을 뽑고 싶으면 민 함수를 사용을 하면 되겠죠 동일하게 해 주시면 됩니다.
그래서 보면 아까 처음에 저희가 정의했던 a는 이렇게 생겼고 그중에서 이제 최대 값은 4겠죠 그러니까 4가 출력된 걸 확인할 수가 있어요.
요거랑 동일하게 이제 x 자리에다가 눈을 넣어주면 가장 작은 값인 1이 출력이 되겠죠
参会者 1 22:43 接下来我们要看基本统计,大家都知道 max 和 min 是什么意思。在这里,我们创建了一个以 1、2、3、4 为元素的二维数组,如果要在这个矩阵中提取最大值,就使用 x,如果要提取最小值,就使用 min 函数。操作方法是一样的。我们之前定义的 a 是这样的,其中最大值是 4,所以你们可以看到输出了 4。同样地,如果在 x 的位置放入 np.min,就会输出最小值 1。
Attendees 1 23:41
이렇게 해 주시면 됩니다. 그다음에 이제 기본 통계 하면은 평균이랑 이제 또 나오겠죠 이렇게 보시면 다시 동일한 이제 a를 지정을 해준 다음에 민 함수를 사용을 하면은 이 어레이의 평균을 확인할 수가 있어요.
근데 여기서도 이제 이 행이랑 열을 지정을 하게 되면은 행별로 평균이랑 이제 열별 평균을 확인할 수가 있어요.
그래서 똑같이 이제 미인을 해서
如果您这样做,那么接下来就是基本统计,现在会出现平均值等。这样查看,然后再次指定 a,接着使用最小函数,就可以查看这个数组的平均值。但在这里,如果指定行和列,就可以按行查看平均值和按列查看平均值。所以同样使用最小值
Attendees 1 24:18
이렇게 해서 결과를 보면 처음에 이제 민 함수만 사용했을 때 결과는 여기 2, 5가 되죠 그리고 여기서 보시면 이제 저희가 소스를 0으로 설정을 했으니까 행별 평균이 나오겠죠
如果这样查看结果,最初仅使用最小函数时,结果是 2、5,而且从这里可以看出,由于我们将轴设置为 0,所以会出现按行的平均值
Attendees 1 24:38
그럼 반대로 이제 축을 1로 지정을 하게 되면은 열별 평균이 나오겠죠
那么,如果将轴指定为 1,就会得到按列的平均值
Attendees 1 24:49
서 실행을 해보면
然后执行
Attendees 1 24:55
이번에 가보니까 1 5만 3 5만 나오게 되죠
参加者 1 24:55 这次去看了,1 个 5 万 3 个 5 万就出来了
Attendees 1 25:06
그다음에 이제 STD를 활용하면 표준 편차를 확인할 수가 있는데 여기서도 행이랑 열을 지정을 해주면 각 행과 열에 대한 표준 편차를 확인할 수가 있어요.
똑같이 MTD를 하고 축을 지정을 해주면 됩니다.
이건 행방향이고
参加者 1 25:06 接下来,如果使用 STD,就可以确认标准差。在这里,如果指定行和列,就可以确认每行和每列的标准差。同样地,使用 MTD 并指定轴就可以了。这是行方向
Attendees 1 25:33
이렇게 하면 1방향이 있죠 이것도 실행을 해보면 얘는 a 그리고 a 평균 행별 평균 열별 평균 그리고 이게 표준 편차죠 여기서도 행별 표준 편차 그리고 열별 표준 편차를 확인할 수가 있어요.
与会者 1 25:33 这样就有了一个方向,如果执行的话,这里是 a,然后是 a 的平均值,按行的平均值,按列的平均值,这是标准差。在这里也可以看到按行的标准差和按列的标准差。
Attendees 1 25:56
그다음에 이 함수를 사용을 하게 되면 그냥 분산을 찾을 수가 있겠죠 얘는 그냥 실행을 해봅시다.
그렇게 되면은
与会者 1 25:56 接下来,如果使用这个函数,就可以找到方差。我们来执行看看。
Attendees 1 26:23
네 여기까지 이제 넘 파스 간단하게 넘파이 간단하게 확인을 해봤고 그다음은 이제 판다스에 대해서 실습을 해볼 거예요.
일단 펀다스에서 보면은 이제 시리즈랑 데이터 프레임 있죠 이거는 다시 실행을 해줘서 모든 출력 모든 결과가 출력되도록 하고 그다음에 이제 넘파이는 보통 MP로 불러오고 판마스는 PD로 불러오죠 이렇게 불러왔어요.
그리고 이제 팬더스를 활용을 하게 되면은 이 리스트로부터 이제 시리즈를 객체를 만들 수가 있어요.
어떻게 하냐면 그냥 간단하게 피이 시리즈를 하고 저희가 리스트를 사전에 정리해 놓지 않았으니까 그냥 바로 넣어줄게요.
이렇게 해서 하면은 이제 다음과 같은 시리즈 객체가 생성이 되겠죠
与会者 1 26:23 好的,我们现在已经简单地查看了 NumPy,接下来将实践 Pandas。首先在 Pandas 中,我们有 Series 和 DataFrame。让我们重新运行以输出所有结果。通常我们把 NumPy 导入为 np,Pandas 导入为 pd。这样导入后,我们可以从列表中创建 Series 对象。方法很简单,只需使用 pd.Series(),然后直接放入列表。这样就会创建一个 Series 对象。
Attendees 1 27:24
그다음에 이제 딕셔너리로부터도 데이터 프레임을 만들 수가 있는데 여기서 이제 다음과 같은 요소를 가진 딕셔널이 있어요.
이걸 데이터 프레임으로 변환을 해볼게요. 그러면 팩이 데이터
与会者 1 27:24 接下来,我们还可以从字典创建 DataFrame。这里有一个包含多个元素的字典。我们将把它转换为 DataFrame。然后 DataFrame 就会...
Attendees 1 27:45
이렇게 해서 해주시면은 이게 원래 딕셔너리 형태였는데 이렇게 데이터 프레임 형태로 출력이 된 걸 확인할 수가 있습니다.
参会者 1 27:45 这样,原本是字典形式,现在可以看到已经输出为数据框格式。
Attendees 1 28:07
그다음에 이제 저희가 인덱스랑 활용 속성을 활용을 해서 이제 행의 인덱스 정보랑 이제 열의 이름을 확인을 할 수가 있는데 저희가 아까 바로 위에서 만들었던 이제 데이터 플레임의 이름을 df라고 했었잖아요 그럼 이 df의 속성에 대해서 확인을 해볼 df 인덱스를 하게 되면은 그러면 이렇게 보시면 행의 인덱스 정보가 나오죠 이제 보시면 인덱스가 0부터 2까지니까 시작은 0이고 3에서 원추고 이제 하나씩 늘어난다고 해요.
보통 이제 파이썬에서도 아까 0 콜럼 3을 하면은 2까지만 나오죠 그런 형태로 봐주시면 됩니다.
그리고 이제 열의 이름을 확인을 할 거면 이 런스 하면 되겠죠 그러면 이제 칼럼의 이름이 이렇게 리스트 형태로 출력이 되는 걸 확인할 수가 있습니다.
参会者 1 28:07 接下来,我们将通过使用索引和属性来查看行的索引信息和列的名称。我们之前将数据框命名为 df。如果查看 df 的索引,你会看到行的索引信息。可以看到索引从 0 到 2 开始,从 0 开始,到 3 为止,逐步递增。通常在 Python 中,如果使用 0 列 3,也只会显示到 2。然后,如果要查看列的名称,只需使用这个方法,这样就可以看到列名以列表形式输出。
Attendees 1 29:08
위에서 보시면 이게 그대로
从上面可以看到,这就是原样
Attendees 1 29:21
네 그다음은 이제 파일로부터 이제 데이터를 불러와 볼 건데요.
제가 이제 올려드렸던 파일에 CSV 두 개가 있었죠 하나는 지금 실습해서 쓸 거고 하나는 이제 퀴즈 풀 때 사용하시면 됩니다.
보시면 이제 아이디스 CSV를 불러온 다음에 실습을 진행을 해볼 건데 해당 이제 파일 같은 경우에는 헤더가 따로 지정되어 있지 않아요.
그래서 만약에 저희가 그냥 원래 블러오는
是的,接下来我们将从文件中加载数据。我之前上传的文件中有两个 CSV 文件,其中一个是我们现在将要实践使用的,另一个是用于解答问题时使用。我们将加载 ID 的 CSV 文件并进行实践。该文件没有单独指定标题。所以如果我们直接加载的话
Attendees 1 29:56
이렇게 사용을 하시게 되면은 맨 첫 번째 행이 무조건 헤드로 지정이 되거든요.
근데 저희는 저희의 파일에서는 바로 처음부터 데이터가 시작이 되니까 패더가 없다고 알려주면 됩니
如果您这样使用,第一行将无条件被指定为标题。但是在我们的文件中,数据从一开始就存在,所以我们需要告诉它没有标题
Attendees 1 30:26
그렇게 하고 이제 저희가 칼럼 이름을 붙여줄 건데
这样做之后,我们现在要为列命名
Attendees 1 30:33
이렇게 보시면 이제 아직 컬럼 이름 여기는 제가 주석 처리를 해놨죠 그래서 불러온 걸 보면은 칼럼 이름이 지정돼 있지 않고 이제 0부터 4까지 왜냐면 5개니까 에 임의로 지정이 됩니다.
저희는 이거를 어떤 수치인지 확인하기 위해서 칼럼 이름을 지정을 해 줄 겁니다.
如果你这样看,现在列名我已经注释掉了,所以当加载时,你会发现列名没有指定,而是从 0 到 4(因为有 5 个)被任意分配。我们将为了确认这些数值是什么,指定列名。
Attendees 1 30:58
게 실행을 해 주면 아까 여기 0부터 4까지 있었는데 지금 저희가 지정한 칼럼 이름으로 바뀌는 거 확인할 수가 있죠 이거는 각각 이제 꽃밭이네 길이와 더비 그리고 꽃잎의 길이와 더비 그리고 클래스 같은 경우에는 어떤 꽃인지 분류 정보를 나타내고 있어요.
执行后,你会发现原本从 0 到 4 的列名已经变成了我们指定的列名。这些现在分别代表花园大小、长度和花瓣的长度,以及类别(表示是哪种花)的分类信息。
Attendees 1 31:45
그다음에 넘어가서 저희가 불러온 데이터로 이제 원하는 값을 출력을 해볼 건데요.
이제 헤드랑 테일 메소드가 있어요. 그래서 헤드랑 테일을 활용을 하게 되면은 저희가 데이터 프레임의 첫 번째 행위랑 이제 마지막 행 부분을 반환을 하게 되는데 지금 여기서 보시면 3개의 이제 행만 반환을 한다고 되어 있죠 해보면 이렇게 해 주시면 처음에 3개만 이렇게 반환이 됩니다.
그리고 이번에 마지막 행이죠 이렇게 해 주시면 마지막이 이렇게 반환이 됩니다.
근데 이거는 저희가 측정 값을 지정을 한 거잖아요.
만약에 과로에서 이제 숫자를 지정을 하지 않게 되면 디폴트 값은 5로 됩니다.
근데 저희가 원했던 거는 이제 아웃풋을 맞추기 위해서 3으로 지정을 해볼게요.
接下来,我们将使用导入的数据来输出我们想要的值。现在有 head 和 tail 方法。使用 head 和 tail 方法,我们可以返回数据框的第一行和最后一行。正如您在这里看到的,它返回了 3 行。如果我们这样做,就会返回最初的 3 行。然后,对于最后一行,如果这样做,就会返回最后的行。但是,这是我们指定的测量值。如果我们在过程中不指定数字,默认值是 5。但为了匹配我们想要的输出,我们将把它设置为 3。
Attendees 1 32:52
그다음에 이제 디스크라이브 메소드를 사용을 하게 되면은 이제 데이터 셋에 포함된 문자열 말고 이제 수치형 칼럼에 대해서 이제 기본적인 통계량을 계산해서 이렇게 보여줘요.
지금 보시면 이제 몇 개인지 그리고 평균이 얼마인지 그리고 표준 편차는 얼마고 최소 값은 얼마인지 여기는 4분 2수겠죠 그리고 가장 끝 값은 얼마인지 이렇게 알려줍니다.
또 간단하게 저희가 아까 불러왔던 df의 디스플레이를 확인하면 다 지금 말하면 동일한 경우가 있죠
接下来,当使用 describe 方法时,它会计算并显示数据集中数值列的基本统计量。正如您现在看到的,它显示了有多少个数据,平均值是多少,标准差是多少,最小值是多少,这里是第四个四分位数,最大值是多少。另外,如果我们简单地检查之前加载的 df 的显示,情况可能都是相同的。
Attendees 1 33:46
그다음에 이제 셀렉션 그러니까 저희가 원하는 값에 대해서 인덱싱을 해볼 건데 여기서 보시면 일단 칼럼의 이름으로 인덱싱을 할 수가 있어요.
저희가 원하는 건 SM스죠 그러면 df에 이렇게 하게 되면 이 칼럼에 대한 결과 값을 가져올 수가 있어요.
이렇게 보시면 가져오죠
接下来,我们将进行选择,也就是对我们想要的值进行索引。在这里,您可以看到,首先可以通过列名进行索引。我们想要的是 SM,那么如果在 df 中这样做,就可以获取该列的结果值。就这样获取。
Attendees 1 34:21
근데 지금은 이제 칼럼 하나에 대한 값만 가져왔는데 여러 개를 가져올 수도 있습니다.
아래에서 보시면 이제 원하는 칼럼이 s 램스랑 p 렌스죠 그렇게 되면 똑같이 해주면 됩니다.
근데 여기서는 이제 위에서 하나를 가져올 때는 대가조를 하나만 해주는데 여러 개를 가져올 때는 이 칼럼 이름들을 리스트 형태로 줘야 되기 때문에 대괄호를 두 개 사용하셔야 합니다.
现在我们只获取了一个列的值,但也可以获取多个。在下面,您可以看到我们想要的列是 S RAM 和 P RAM。这样的话,操作方法是一样的。但是,在之前获取单个值时,只需使用一个中括号,而获取多个值时,需要使用两个中括号,因为列名需要以列表的形式提供。
Attendees 1 34:54
시게 되면은 이렇게 두 개의 칼럼에 대한 이제 핸들이 출력이 되는 걸 확인할 수가 있습니다.
当您执行此操作时,您可以确认两列的句柄已输出。
Attendees 1 35:14
그다음에 이제 데이터 프레임에서 LC랑 ilc 속성을 사용을 하게 되면은 굳이 이렇게 이름을 지정하지 않고도 이름을 가져하거나 아니면 이제 이름을 지정하지 않고도 가져올 수가 있는데 여기서 보시면 이제 행 라벨의 인덱스 중에서 이제 0번이랑 2번이랑 4번만을 가져올 거고 그러니까 0 번째 두 번째 네 번째 핵만 가져올 거고 원하는 칼럼 이름은 s 램스랑 b 램스라고 그러면 그냥 해주면 됩니다.
LC를 사용을 해서 일단 이렇게 해서 보면 이렇게 앞이랑 저랑 앞부분이 이제 행렬에 대한 정보를 저희가 넣는 부분이고 두 번째가 열에 대한 정보를 넣는 부분이에요.
그래서 원하는 행위 02 4니까 그대로 넣어주면 되겠죠 02 이렇게 하면 이제 행 정보를 저희가 제공을 해줬고 그다음에 이제 칼럼 정보를 넣어주면 되겠죠 칼럼은 SNS랑 피 이렇게 두 개로 넣어주면 되겠죠 그래서 실행해서 보면은 s 랭스랑 p랭스의 칼럼의 정보 중에서 0 번째 두 번째 네 번째 행만 가져오는 걸 확인할 수가 있죠.
接下来,在数据框中使用 LC 和 ILC 属性时,无需明确指定名称就可以获取名称。在这里,您可以看到从行标签索引中仅选择 0、2 和 4 号,也就是第 0、第 2 和第 4 行,如果您想要的列名是 S RAM 和 B RAM,那么就直接这样做即可。使用 LC,如果这样看,前面部分是我们输入矩阵的信息部分,第二部分是输入列的信息部分。因此,如果所需的行是 0、2、4,就直接输入即可。这样我们就提供了行信息,然后输入列信息。列可以是 SNS 和 P,这样执行后,您可以确认仅获取了 S RAM 和 P RAM 列中的第 0、第 2 和第 4 行。
Attendees 1 36:36
제 방금 했던 LC 같은 경우에는 이제 라벨을 기반으로 인덱싱을 제공을 하는 거고 이제 여기 iloc를 사용을 하게 되면 이름을 지정하지 않고 이제 위치 특정 위치를 제공을 해줘서 인덱싱을 진행하게 됩니다.
여기서 보시면 이제 행이랑 여이랑 둘 다 0부터 0 콜론 3이니까 0부터 2까지겠죠 3바이 3의 결과를 가져올 건데 동일하게 하면 되겠죠 df IC 치고 행정보랑 열 정보를 주면 원하는 게 나옵니다.
생 같은 경우는 이제 0부터 2까지고 열 같은 경우는 이게 위치 기반이기 때문에 저희가 처음에 여기서 보시면 처음에 칼럼을 지정했을 때 요 순서로 칼럼을 지정했었죠 그래서 0 번째 첫 번째 두 번째 여기까지 가져오게 되는 겁니다.
对于我刚才讲的 LC 来说,现在是基于标签进行索引的提供,当使用 iloc 时,不指定名称,而是提供特定位置来进行索引。在这里,你可以看到,行和列都是从 0 开始,0:3 表示从 0 到 2,获取 3x3 的结果。同样地,使用 df.iloc 并提供行和列信息,就可以得到想要的结果。列是基于位置的,所以当我们最初指定列时,按照那个顺序,我们获取第 0、第 1 和第 2 列。
Attendees 1 37:57
그다음에 이것도 많이 쓰지만 이제 보통 이제 데이터 프레임을 사용을 할 때 가장 많이 쓰는 게 블린 인덱싱인데 이거 같은 경우에는 이제 특정 조건에 해당하는지 트루랑 포스를 판단을 해서 그 조건에 맞는 색만 가져오게 됩니다.
색이라는 얘기는 그래서 여기서 보시면 지금 SMS의 길이가 7, 5보다 큰 번만에 가져올라가 되어 있죠.
그러면 이제 저희가 df에서 가져오게 될 건데 조건을 넣어주면 되겠죠 df에 s렌스가 7, 5보다 큰 여기서 보시면 이제 이게 트루랑 포스로 판단이 되니까 해당하는 것만 가져오게 됩니다.
이제 실행을 하게 되면은 여기서 보시면 sx가 다영 7 5다 큰 점만 가져온 걸 확인할 수가 있죠.
接下来,虽然这也经常使用,但在使用数据框时最常用的是布尔索引。这种情况下,判断是否符合特定条件,通过真值和假值,只获取符合该条件的列。这里,你可以看到只获取 SMS 长度大于 7、5 的部分。那么在 df 中,只需添加条件,比如 df 中长度大于 7、5 的部分。由于这是通过真值和假值判断的,所以只会获取符合条件的部分。执行后,你可以看到只获取了大于 7、5 的 sx 部分。
Attendees 1 39:01
그리고 아까는 이제 만약에 에렌스라는 이제 칼럼 에 대한 값들을 가져오고 싶으면 무조건 요런 식으로 사용을 했는데 지금 여기서 보시는 에렌스 같은 경우에는 공백이나 아니면 특수 문자가 없는 문자잖아요.
요런 경우에는 문자열로 유효한 속성을 가졌기 때문에 이런 식으로 대괄호를 사용하지 않고도 그냥 이렇게도 가져올 수가 있습니다.
그래서 이렇게 하시면 SXX에 해당하는 값들이 이렇게 나오죠 저희가 원하는 거는 이 값들의 평균이니까 MP김을 활용을 하면 됩니다.
参会者 1 39:01 如果我们想获取以前的列(如 Erens)的值,之前总是这样使用。但现在看到的 Erens 是没有空格或特殊字符的文本。在这种情况下,因为它具有有效的字符串属性,所以可以不使用方括号,直接这样获取。这样的话,SXX 对应的值就会像这样显示出来。我们想要的是这些值的平均值,所以可以使用 MP K。
Attendees 1 39:45
이렇게 해서 하면은 이제 에랭스 값들의 평균이 나올 수 있죠.
参会者 1 39:45 这样就可以得到 Erens 值的平均值了。
Attendees 1 40:00
그리고 이제 특정 행위랑 열을 골라서 이제 넘파이 배열로도 추출이 가능한데 지금 여기서 보시면 이제 로우 조건이 0부터 9까지고 칼럼이 0이랑 2만 있습니다.
그러면 그냥 아까 했던 IC를 활용을 해서 가져오는 거겠죠 IC를 가져와서 0부터 9까지니까 0 1이고 그리고
出席者 1 40:00 现在,您可以从特定的行和列中提取 NumPy 数组。在这里,您可以看到行条件是从 0 到 9,列是 0 和 2。那么,我们就像之前使用 IC 一样来获取它,获取 IC,因为是 0 到 9,所以是 0 和 1,然后
Attendees 1 40:34
열 조건을 0이랑 2만 주고요. 그리고 밸류스를 하게 되면은 이제 밸류스를 붙여주면 여기에서 값만 가져오게 되겠죠 이렇게 하면은 요 해당하는 데이터 프레임이 이제 넘 파이 배열로 가져오게 됩니다.
반만 가져와서 어레이 형태가 된 걸 확인을 할 수가 있어요.
出席者 1 40:34 只给出列条件 0 和 2。然后,当我们使用 values 时,就会获取这里的值。这样,我们就可以将相应的数据框作为 NumPy 数组获取。我们可以确认已经将一半数据以数组形式提取出来了。
Attendees 1 41:01
이제 다음에 맥플러리 라이브러리를 활용을 해가지고 또 이제 플러을 찍어볼 건데 아까 여기서는 이제어를 활용을 했기 때문에 모든 결과가 출력되도록 했는데 이번에는 이제 라스틱 스프레션 조건만 사용을 해가지고 이제 디폴트 값인 마지막 결과만 출력이 되도록 하게 되면 됩니다.
가장 기본은 이제 플러시죠 요거는 이제 선 그래프인데 이 라이브러리는 이제 pp로 불러오고 넘파이는 아까 저희 MP로 인포트하게 됩니다.
여기서 보시면 이제 x랑 y를 각 리스트로 정리를 해줬고요.
이제 여기서 보면은 x랑 y를 활용을 해서 플러스 빌이라고 그러면 PLT의 이제 함수 줄까 PT 플레 마 y 이렇게 하면은 이제 x 값이랑 x랑 y를 활용을 해서 그래프를 그리겠다.
이런 의미겠죠 근데 이번에는 라벨도 설정을 하고 싶어요.
아래에서 그래프를 보시면 지금 x 자리에는 이제 인풋이 되어 있고 y 자리에는 아웃풋인 라벨이 있죠 요거를 지정을 해주는 겁니다.
现在我们将使用 MacPLU 库来绘制图表。之前我们使用了一些其他方法让所有结果都显示出来,这次我们将仅使用弹性条件,只输出默认值的最后一个结果。最基本的是图表,这是一个线图,这个库现在通过 pp 导入,NumPy 之前我们用 MP 导入。在这里您可以看到我们已经将 x 和 y 整理成了列表。在这里,我们可以通过使用 x 和 y 来绘制图表,如果使用 PLT 的函数,PT 播放 y,这样就是用 x 和 y 值来绘制图表的意思。这次我们还想设置标签。在下面的图表中,x 位置现在是输入,y 位置是输出标签,我们要指定这个。
Attendees 1 42:25
그다음에 KT 와드 라는 거 하면
然后是 KT 沃德
Attendees 1 42:36
이렇게 그다음에 이제 이 그래프를 보여야 되니까 피렌티 마 슈를 함수를 사용을 하게 됩니다.
이렇게 해서 실행을 하게 되면은 아까랑 똑같은 그래프가 나오죠 이제 1부터 5까지고 여기는 이제 y인은 제일 싼 값이 1이고 제일 큰 값이 125였으니까 이렇게 지정이 되고 저희가 설정한 이제 라벨 값을 가지고 있는 걸 확인할 수가 있습니다.
여기만 논이었죠 그래서 x랑 y를 사용해서 플라스 그리고 이제 라벨을 지정하고 그걸 보여주는 겁니다.
그다음에 이제 플라담수를 사용을 할 때 이렇게 하는 게 가장 간단한 형태지만 여기서 보시면 이제 컬러를 지정을 하거나 마커를 지정하거나 아니면 라벨도 지정을 할 수가 있어요.
라벨은 아까 위에서 해봤었죠 근데 이제 따로 하지 않고 플라 탐수를 하면서 한 번에 할 수도 있습니다.
지금 여기서 보시면 이제 여기서 이게 틀렸던데 어 주시면 됩니다.
어차피 결과는 똑같으니까 이제 어레인지죠 0부터 그리고 5까지 근데 간격은 0
参与者 1 42:36 接下来,为了显示这个图表,我们将使用 plt.figure 函数。执行此操作后,将出现与之前相同的图表。现在是从 1 到 5,这里 y 轴的最小值是 1,最大值是 125,因此可以这样设置,并且可以确认我们设置的标签值。这里是无。因此,我们使用 x 和 y 进行绘图,并设置标签并显示它。然后,在使用 plt 时,这是最简单的形式,但如您所见,可以指定颜色、标记或标签。标签我们之前已经尝试过了,但现在可以在绘图时一次性完成。在这里,如果您看到这里有错误,只需给出即可。无论如何结果都是一样的,现在是从 0 开始,到 5 结束,但间隔是 0
Attendees 1 43:55
이렇게 균등하게 샘플링 된 이제 1차원 배열 티를 생성을 해주고 이거는 어떤 의미냐면 지금 아까 똑같죠 x 축에는 t를 넣고 y 축에는 t 제곱을 넣을 거예요.
근데 그때 이제 이 선형 그래프의 색깔은 r이니까 웨드겠죠 빨간색으로 지정을 하고 그리고 와코 같은 경우에는 오니까 동그라미로 지정을 할 겁니다.
그리고 라벨 같은 경우에는 이제 이게 2차 함수에 대한 값이니까 2차 함수로 라벨을 설정을 하겠다 이런 의미입니다.
그러면 그다음에 주석을 보면 지금 똑같은데 이번에 3차를 넣었고 색깔은 파란색으로 하고 라퍼는 네모로 하고 그리고 3차원을 넣겠죠
参与者 1 43:55 这样生成了均匀采样的一维数组 t。这是什么意思呢?就像之前一样,x 轴放 t,y 轴放 t 的平方。但是这次线性图的颜色是 r,所以会是红色,并且标记将是圆形。标签将设置为二次函数,因为这是二次函数的值。然后在注释中,现在是一样的,但这次放入了三次方,颜色是蓝色,标记是正方形,并且将放入三次方
Attendees 1 44:42
이 기호를 두 개를 하면은 이제 제곱이 되겠죠 컬러는 하 고 앞에는 에스가 스케어를 이미
与会者 1 44:42 如果使用两个这个符号,现在就变成平方了。颜色是"哈",前面是"S"的平方根,已经
Attendees 1 45:06
이랑 동일하지만 요 안에 요소만 살짝씩 바꿨죠 그다음에 이제 레존드 같은 경우에는 그래프의 본래를 표현을 하는데 보통 이거는 이제 색깔이랑 뭐 마커가 어떤 건지를 나타내는 거죠.
요 정보들을 그냥 간단하게 함께 볼 수 있도록 넣어놓은 거예요.
하고 같이 들어가고요. 여기서도 이제 그래프가 출력이 되어야 되니까 pp 쇼감수로 사용하는 이렇게 해서 실행을 해 주면
与会者 1 45:06 与之类似,但是里面的元素稍微改变了。接下来,图例的情况是表示图形的本质,通常是表示颜色和标记是什么。这些信息是为了简单地一起查看而放入的。并且一起进入。在这里,因为需要输出图形,所以使用 pp 显示,这样执行就可以了
Attendees 1 45:51
그래서 보시면 지금 빨간색이 2차 함수고 파란색이 3차 함수죠 그리고 마커는 저희가 지정한 대로 이제 동그라미랑 네모가 되어 있고 저희가 예정대로 넣었기 때문에 여기에 본내가 추가되는 것을 확인할 수가 있습니다.
所以你可以看到,现在红色是二次函数,蓝色是三次函数,而标记符号是我们按照预定的方式变成了圆圈和方形,因为我们按计划放置,所以可以确认本质已经被添加。
Attendees 1 46:11
그다음에 이제
接下来是现在
Attendees 1 46:18
그다음에 이제 산전도인데 여기를 보시면 일단 처음에 데이터를 지정을 데이터를 만들어 줄 건데 아까 요거를 사용을 하게 되면은 0 이상 1 미만 범위에서 랜덤 난수를 생성하게 되는 거죠.
근데 이제 쉐입은 0바이 2겠죠 이렇게 데이터를 생성을 하게 되고 그냥 팩터 함수를 사용을 하게 되면은 선정도가 그려지게 됩니다.
接下来是扇形图,在这里您可以看到,首先我们将创建数据。刚才使用这个方法时,将在 0 到 1 的范围内生成随机数。现在,形状将是 0 乘 2,像这样生成数据,如果使用因子函数,则会绘制密度图。
Attendees 1 47:12
KT 근데 제가 지금 아까 결과값을 지워버렸는데 보시면
参会者 1 47:12 KT 我现在已经删除了之前的结果值,请看
Attendees 1 47:27
이게 아까 에스 축이라고 했죠
出席者 1 47:27 这是之前说的 S 轴,对吧
Attendees 1 47:49
그리고 색깔은 아까 빨간색이었죠 빨간색이니까 레드로 해도 되고 알로 해도 돼요.
그리고 마터는 x였죠 그러니까 이렇게 엑스를 지정을 해 주면 됩니다.
그리고 얘도 그래프니까 쇼수 사용하면 되겠죠 쇼를 하게 되면은
出席者 1 47:49 然后颜色是之前的红色,所以可以用红色(Red),也可以用红色(Alo)。然后 Matter 是 x,所以就这样指定 x。然后这个也是图形,所以可以使用 Show 函数,使用 Show 的话
Attendees 1 48:20
이렇게 하시면 다음과 같이 선택 눌러 출력이 된 걸 확인할 수가 있습니다.
如果这样操作,您可以确认按选择并输出如下。
Attendees 1 48:37
요거를 보시면 이제 그냥 간단하게 모든 행에 이제 첫 번째 열이니까 그게 x 자표로 들어가는 거고 요거는 모든 행에 두 번째 열인 열이 이제 와이 샤프로 들어간다고 이해를 해 주시면 됩니다.
当您查看这个时,由于它是所有行的第一列,所以 x 坐标进入,而第二列是 y 坐标进入,请这样理解。
Attendees 1 48:57
이렇게 3 정도였고요. 그다음에 이제 바 그래프를 확인을 해볼 건데 그냥 간단하게 이건 빠를 사용을 해 주면 돼요.
똑같죠 여기서도 이제 데이터를 다음과 같이 정리를 하고 이제 인덱스를 2015부터 2018까지 연도로 지정을 해 주셨어요.
参与者 1 48:57 大约是 3 个这样。然后接下来要查看条形图,只需使用柱状图就可以了。这里也是一样,现在按照这种方式整理数据,并将索引设置为从 2015 年到 2018 年的年份。
Attendees 1 49:19
그래서 주어진 데이터에 대해서 이제 빵 그래프를 그려볼 건데 간단하게 PT 파를 하면 되겠죠 근데 이제 x 자리 x 자리에 인덱스 인덱스를 넣고 연도겠죠 그리고 y 축 자리에 데이터를 넣어주면 각 연도에 해당하는 데이터를 데이터가 y 축으로 되겠죠 그리고 색깔은 여기서 보시면 파란색이죠 파란색을 그러니까 어 주고요.
그다음에 이제 너비를 조절을 할 수가 있는데 너비를 0 5로 해 주고
参与者 1 49:19 所以对于给定的数据,现在要绘制饼图,简单地使用 PT 文件就可以了。但是现在在 x 轴位置放置索引,索引就是年份,y 轴位置放置数据,这样每年对应的数据就会在 y 轴上。从这里可以看到颜色是蓝色,所以给蓝色。然后可以调整宽度,将宽度设置为 0.5。
Attendees 1 49:59
그리고 여기도 PD 쇼 해서 출력을 하면 되겠죠 그리고 실행한 결과를 보시면 지금 x 축에는 인덱스가 들어갔고 y 축에는 해당되는 데이터가 이제 표현이 되고 있어요.
그리고 너비 같은 경우는 이 그래프의 너비인데 저는 0 5로 지정을 해줬고 이거를 좀 더 큰 값으로 하게 되면은 그래프가 조금 더 뚱뚱해지겠죠 이렇게 근데 이제 제가 주어진 아웃풋은 0 5였을 때 아웃풋이었으니까 다시 0 5로 해줄게요.
이렇게 바그래프도 지정을 해줬습니다.
与会者 1 49:59 然后在这里也进行 PD 展示并输出,执行结果显示,现在 x 轴上显示的是索引,y 轴上则显示相应的数据。关于宽度,这是图形的宽度,我将其设置为 0.5,如果将其设置为更大的值,图形就会变得更胖。但由于给定的输出是在 0.5 时,我将再次将其设置为 0.5。这样我就指定了条形图。
Attendees 1 50:43
그다음에 이제 히스토그램을 볼 건데 여기서도 보면은 이제 평균이 0이고 표준 편차가 1인 전규 분포로부터 이 100개의 난수를 생성을 해서 엑셀에 넣는 거죠.
그다음에 이제 이 히스트 함수를 활용을 해가지고 히스토그램을 그릴 수가 있는데 지금 보시면 구간이 100으로 되어 있어요.
그러면 저희가 이제 100개의 구간으로 나누어서 요 리스토리 그림을 그려봐야 되는 거죠.
보시면 간단하게 PD인데 주어진 데이터가 있죠 그리고 이제 주간을 지정을 할 수가 있어요.
저는 100개로 지정을 해볼게요. 그리고 여기 아래에서 보시면 이제 타이틀 있죠 타이틀이 노멀 디스트리뷰션 그래서 타이틀도 작성을 해주면 됩니다.
PT 타이틀 똑같지
与会者 1 50:43 接下来我们要看直方图,从这里可以看到,从平均值为 0,标准差为 1 的正态分布中生成了 100 个随机数,并放入 Excel 中。然后利用直方图函数,我们可以绘制直方图。现在可以看到区间是 100。那么我们将把 100 个区间分开,绘制这个直方图。你可以看到这是一个简单的 PD,有给定的数据,并且可以指定区间。我将把区间设置为 100。在下面,你可以看到标题,标题是"正态分布",所以也要添加标题。PT 标题是一样的。
Attendees 1 51:40
이기도 그래프니까 PT 쇼로 하면 되겠죠
出席者 1 51:40 既然是图形,就用 PT 演示吧
Attendees 1 51:49
그래서 히스토그램 난수를 생성을 한 다음에 그걸로 히스토그램을 그릴 건데 데이터는 x로 주고 구간은 100으로 잡아주세요.
그리고 타이틀도 설정을 해 주고 이제 쇼색을 사용해서 보여줬습니다.
만약에 이제 구간을 10개로 설정을 하게 되면은 이렇게 데이터가 조금 더 범위가 10개만 지정이 되니까 단 덜 정확한 히스토그램 그래프가 보이겠죠 이거는 이제 사용자의 편의성에 따라서 이 구간을 조절해가지고 저희가 분포를 확인하는 겁니다.
그럼 이렇게 100개로 해서 넘어갈게요.
出席者 1 51:49 所以我们将生成随机数,然后用这些数据绘制直方图。数据用 x 给出,区间设为 100。然后设置标题,并使用显示颜色展示。如果将区间设置为 10 个,那么数据的范围就会被限定在 10 个区间内,直方图可能会显得不太精确。这取决于用户的需求,我们可以调整区间来观察分布。那么就这样用 100 个区间继续吧。
Attendees 1 52:32
그다음에 이제 그래프는 여기서 끝이고 다음에 사이킹 런에 대해서 확인을 해볼 건데 우선은 아까는 마지막 것만 출력하는 코드를 실행을 했었는데 이번에 다시 전체를 실행하는 코드를 실행을 해줄게요.
그다음에 이제 모델을 학습해 볼 건데 어떤 거냐면 이렇게 x1, x2, x3 형태의 x가 주어졌을 이 x를 y나 0으로 이제 분류해 주면 되는 테스트입니다.
그래서 이제 정답이 있는 논 레이블이죠 정답 라벨이 있는 5개의 샘플을 제공을 해주고요.
그래서 넘 파일을 불러오고 데이터도 이렇게 주어졌어요.
그래서 보시면 지금 x1, x2, x3 이 형태로 하나씩 이제 제공이 되는 거고 이 첫 번째 데이터에 대한 y 값은 1인 거고 두 번째 데이터에 대한 y 값은 0인 거고 이제 세 번째는 1, 네 번째는 1 그리고 마지막으로 x에 대한 y 값은 0이겠죠 이렇게 데이터가 주어졌고 일단 아까 배웠던 셰입 함수를 사용을 해서 x랑 y의 쉐입을 확인을 해볼게요.
x
接下来,图表到此结束,接下来我们将检查 scikit-learn。之前我们只执行了输出最后一个的代码,这次我将再次执行整个代码。然后,我们将进行模型学习,具体来说,当给定 x1、x2、x3 形式的 x 时,需要将 x 分类为 y 或 0。因此,我们提供了 5 个带有正确标签的样本。我们加载了 NumPy 文件,数据也是这样给出的。可以看到,x1、x2、x3 现在是逐个提供的,第一个数据的 y 值是 1,第二个数据的 y 值是 0,第三个是 1,第四个是 1,最后一个 x 的 y 值是 0,数据就是这样。我将像之前学过的那样使用形状函数来检查 x 和 y 的形状。x
Attendees 1 53:51
이렇게 해서 해보면 지금 x 같은 경우에는 오컨마한 그리고 y 같은 경우에는 이죠
这样操作后,x 现在是这样的,而 y 是这样的
Attendees 1 54:03
그 셰이을 확인을 해줬고 그다음에 저희가 이제 사이킨런에서 의사결정 나무 분류기를 가져올 건데 가져와서 이제 이 CF 객체로 정의를 해볼 거예요.
여기서 보시면 지금 이 사이클 런에서 얘를 인풋해왔죠 얘를 그대로
与会者 1 54:03 他确认了那个形状,然后我们现在将从 scikit-learn 中获取决策树分类器。我们将把它定义为 CF 对象。在这里,你可以看到我们直接从 scikit-learn 中导入了它。
Attendees 1 54:29
이렇게 정리를 해줍니다. 그럼 얘를 불러왔고 이제 CLF라는 이 의사결정 나무 부르기가 하나가 이제 생성이 되는 거예요.
그럼 얘를 이제 가져왔으니까 학습을 시켜줘야겠죠 이제 학습은 이 분류기에다가 b 함수를 사용을 해서 블류 모델을 학습하면 되는데 저희가 아까 위에서 정리했던 값이 x랑 y죠 x랑 y를 넣어주면 돼요.
이렇게 해서 이 코드를 실행을 하게 되면은 아까 우리가 만들었던 이제 객체를 학습을 할 수가 있는 거죠.
그래서 실행을 해 주면 이렇게 디시전 트리 클래시 바이오가 생성이 되죠 이게 노트북이랑 코랩이랑 약간 다를 수가 있는데 코랩 스시는 요게 좀 다른 형태로 나타날 수는 있어요.
지금 주피터 노트북을 사용하시면 이 결과가 나오시면 됩니다.
与会者 1 54:29 这样就整理好了。我们已经调用了它,现在创建了一个名为 CLF 的决策树分类器。既然已经获取了它,我们现在需要对其进行训练。训练可以使用 b 函数对分类模型进行学习,我们只需要输入之前整理好的 x 和 y 值。这样执行这段代码后,我们就可以对之前创建的对象进行学习。执行后,决策树分类器就会生成。这可能在笔记本和 Colab 上显示略有不同,Colab 可能会以稍微不同的形式呈现。如果你使用 Jupyter 笔记本,就会出现这个结果。
Attendees 1 55:34
그러면 이제 저희가 이 분류기를 학습을 한 거예요.
그럼 이 학습한 이제 모델을 가지고 테스트 데이터에 적용을 해봐야겠죠 그래서 두 개의 데이터 셋을 주고 얘를 학습해 분류해 보라고 할 거예요.
그래서 텍스트 데이터는 다음과 같이 이제 x 두 개 y 2 개 이 형태로 제공이 됩니다.
아까 위에서 학습했던 CF 모델을 가지고 이제 라벨을 예측을 해볼 건데 지금 이 함수를 이 코드를 실행을 하게 되면은 이제와 테스트니까 이건 실제 라벨 값이죠 그리고 이 함수를 사용을 해서 저희가 학습한 이제 CLF을 적용을 해서 예측 결과를 반환할 수가 있습니다.
간단하게 저희가 아까 앞에서 사전 학습을 했던 CF를 가져오고 이 프리딕트 함수를 사용하는 근데 어떤 값에 대해서 예측을 하는 건지 알려줘야 되니까 x 값을 알려주면 되겠죠 스트 이렇게 해주면 이제 이 모델이 이제 분류한 y에 값이 이 안으로 들어가겠죠
听众 1 55:34 现在我们已经训练了这个分类器。那么接下来我们要将这个训练好的模型应用到测试数据上。我们会给出两组数据集,让它进行学习和分类。因此,文本数据将以这种方式提供,即 x 两个,y 两个这种形式。我们将使用之前学习的 CF 模型来预测标签。当执行这段代码时,由于这是测试数据,这是实际的标签值,通过使用这个函数,我们可以应用我们训练的 CLF 并返回预测结果。简单地说,我们使用之前预先训练的 CF,并使用预测函数,但需要告诉它对哪些值进行预测,所以提供 x 值就可以了。这样,模型分类的 y 值就会进入其中。
Attendees 1 56:44
그리고 얘를 출력을 해볼 겁니다. 실행을 해 주면 아까 실제 라벨 같은 경우는 0이랑 1이었는데 예측 라벨도 0이랑 1로 잘 예측된 걸 확인할 수가 있어요.
그다음에 이제 저희가 테스트를 진행을 해봤으니까 정확도를 확인을 해봐야겠죠 그래서 여기서 보시면 이제 실제 테스트 값이랑 그러니까 2 라벨이랑 저희가 예측한 라벨이 같은지 비교를 해보면 됩니다.
간단하게 점 함수를 사용해서 할 건데 이 테스트는
听众 1 56:44 然后我们将输出它。执行后,可以看到,与之前的实际标签 0 和 1 一样,预测标签也很好地预测为 0 和 1。接下来,既然我们已经进行了测试,就需要确认准确性。在这里,我们可以比较实际测试值,即标签,和我们预测的标签是否相同。我们将使用点函数简单地进行这个测试。
Attendees 1 57:33
이렇게 하면은 이제 예측값이 실제 트 라벨이랑 실제 값이랑 예측 값이랑 같은 경우에 대해서만 1이 반환이 되고 나머지는 0이 반환이 되겠죠 그걸 모두 더해준 다음에 개수로 나눠주면 됩니다.
参会者 1 57:33 这样的话,当预测值和实际标签或实际值相同的情况下会返回 1,其他情况则返回 0。然后将所有这些值相加,再除以总数就可以了。
Attendees 1 57:52
이렇게 하게 되면은 확률이 나오긴 하지만 이제 100%가 1인 확률이 나오겠죠 그래서 저희는 확률 형태로 보고 싶으니까 앞에 100을 곱해주면 됩니다.
그러면 정확도가 나오겠죠 그래서 이걸 실행을 해주면 정확도는 100이 나온 걸 확인할 수가 있습니다.
아까 테스트 값이랑 이제 실제 값이랑 모두 같았었죠
参会者 1 57:52 这样做的话,虽然会得到概率,但现在是 100%的 1 的概率。因此,我们想以概率形式查看,可以在前面乘以 100。这样就会得到准确率。执行后,可以看到准确率是 100。之前测试值和实际值都是相同的。
Attendees 1 58:26
네 그다음은 이제 방금까지는 제가 처음에 깔아달라고 했던 사이킬런 라이브러리로 실습을 한 거고 이제는 그레비즈 라이브러리를 사용을 해가지고 이제 저희가 위해서 만들었던 의사결정 나무 모델을 직접 확인을 해볼 겁니다.
요거 같은 경우에는 윈도우에서 이렇게 콘다 인스토를 하면 잘 안 갈리는 경우가 있어요.
그럴 때는 이제 홈페이지에 가가지고 직접 x 파일을 다운받아서 경로 설정을 해주시면 됩니다.
그래서 사이키만에서 이제 트리를 가져오고 글레이즈를 가져올 거예요.
그래서 이 함수를 실행을 해보면 다음과 같이 나오겠죠
出席者 1 58:26 是的,接下来我们将使用格雷维斯库来验证我们之前使用 scikit-learn 库构建的决策树模型。在 Windows 上使用 Conda 安装时,有时可能会出现问题。在这种情况下,您可以直接从官网下载 x 文件并设置路径。我们将从 scikit-learn 中导入树模型,并导入格雷维斯库。执行此函数后,结果将如下所示。
Attendees 1 59:17
여기서 보면 아까 그 정의 저희가 학습했던 CLF 모델을 가져와서 넣어줬고 이거를 다음과 같은 같은 조건을 사용해서 얘가 이제 분류를 했다는 걸 확인할 수가 있습니다.
出席者 1 59:17 在这里,您可以看到我们之前学习的 CLF 模型被引入,并使用这些条件进行分类,从而确认了模型的分类结果。
Attendees 1 59:33
네 그리고 다시 요거를 실행을 해주면 마지막 것만 출력되겠죠 이제 퀴즈 하실 때는 이게 필요해가지고 이걸 넣어줬으면 좋겠 오늘 퀴즈는 총 4가지가 있는데
与会者 1 59:33 是的,再次执行这个操作将只会输出最后一个。现在在测验时,希望能够使用这个。今天的测验总共有 4 个部分
Attendees 1 59:52
3번에서 보면은 제가 올려드렸던 아마 CSV 파일을 활용해서 진행하는 문제가 있을 거예요.
퀴즈를 간단하게 설명을 해드리면 이거는 이제 투어레이를 사용을 하는 거죠 이제 어레인지랑 이식을 활용을 해가지고 이제 텐바이텐 매트리스를 만들고 a를 출력을 해보고 그다음에 이제 투마 식스 매트릭스를 만든 다음에 이제 이 조건에 맞춰서 슬라이싱을 해보고 그다음에 b를 전치해서 출력을 해보고 b의 셰입이랑 b 전치하는 것의 셰입을 확인을 해보고 그다음에 이제 씨를 계산해 가지고 출력을 해보면 됩니다.
그래서 조건은 이렇게 되어 있고 그다음에 이제 두 번째는 그냥 이제 벡터 계산하는 건데 x랑 y랑 이렇게 주어졌을 때 이제 y는 다음과 같은 형태로 저희가 계산을 할 수가 있어요.
w x 플러스 b죠 그래서 이제 x랑 w랑 b가 주어졌을 때 이제 y를 계산을 하고 계산을 해가지고 출력을 해 주시면 됩니다.
이제 포문을 사용해서 y를 계산을 해 주시면 되고
与会者 1 59:52 在第 3 部分,您可能会使用我上传的 CSV 文件进行问题。简单解释一下测验:这是使用 NumPy 数组,利用排列和索引创建 10x10 矩阵,然后输出 a,接着创建 2x6 矩阵,根据条件进行切片,然后转置 b 并输出,检查 b 的形状和转置后的形状,最后计算并输出 c。所以条件是这样的,接下来第二部分是向量计算,当给定 x 和 y 时,y 可以通过以下方式计算:w * x 加 b。因此,当给定 x、w 和 b 时,计算并输出 y,可以使用 for 循环计算 y
Attendees 1 1:00:59
그다음에 행렬 곱션을 사용해 주시면 됩니다. 여기서 보시면 이렇게 저희가 x랑 w랑 b는 제공을 해드렸고 요 부분이 비어 있죠 이 부분을 작성을 해 주시면 여기서도 이제 y 계산하는 걸 작성을 해 주시면 되고 이제 마지막은 이제 보스턴 집값 주택 가격 데이터인데 요거는 칼럼 설명이에요.
제공해드렸던 CSV 파일이 하나는 아이리스 데이터고 하나는 이 보스턴 집값 데이터인데 이걸 불러오셔가지고 이제 두 변수 간에 관계를 시각화해 주시면 됩니다.
그다음에 이제 RM 이제 두 가을 10으로 설정을 한 다음에 히스토그램으로 시각화해 주시면 됩니다.
여기가 비어 있죠 이거 채워서 이 값이 나오게 하면 돼요.
이게 크기나 뭐 이제 그런 건 상관이 없는데 동그라미고 파란색인 것만 확인을 할 수 있으면 됩니다.
얘도 동일해요.
参会者 1 1:00:59 接下来使用矩阵乘法。在这里,我们已经提供了 x、w 和 b,这部分是空的。请填写这部分,然后计算 y 值。最后是波士顿房价数据,这是列的说明。我们提供的 CSV 文件是鸢尾花数据和波士顿房价数据,请加载数据并可视化两个变量之间的关系。然后将 RM 设置为 10,并用直方图进行可视化。这里是空的,请填写这个值。颜色大小无关紧要,只需确认它是蓝色的圆圈即可。这也是一样的。
Attendees 1 1:02:05
그리고 아까 제가 보여드렸었죠 여기에서 이제 주방 값을 몇 개를 설정해가지고 이런 형태가 나오는지 그다음에 이제 마지막 문제는 와이디스 데이터 셋인데 아까 썼었죠 그거를 다시 가져와서 사용을 해 주시면 됩니다.
그래서 여기는 아까 뭐 칼럼 설명이고 아이비스 데이터를 불러온 다음에 이렇게 밸류스를 사용을 해서 파이어로 만들 수가 있다고 했죠 그렇게 해서 x랑 y ray를 만들고 뭐 평균 값을 계산을 하고 시각화해서 플라스를 찍어주시면 됩니다.
여기서 보시면 독건문이 다 나와 있어요. 그리고 아까 블린 인덱싱 배웠죠 이 안에 조건을 사용을 해가지고 만약에 이 조건이면 어떻게 해석을 하면 되냐면 이제 y는 이 조건을 가진 이제 y가 이 클래스인 거죠.
이 조건을 가진 값들만 가져오게 되는 겁니다. 이것도 이제 논 부분을 채워주시면 됩니다.
그리고 마지막에 최종적으로 이 그래프가 나오는 데요.
参会者 1 1:02:05 之前我向您展示过,在这里设置几个厨房值,看看会出现什么样的形态。最后一个问题是使用 WIDS 数据集,就像之前使用的那样。这里是列的说明,加载鸢尾花数据,然后使用 values 创建饼图,正如我之前说过的。这样创建 x 和 y ray,计算平均值并进行可视化和绘图。在这里,所有的独立变量都已列出。我们之前学习了布尔索引,使用条件,如果是这个条件,解释就是 y 属于这个类。只获取符合此条件的值。请填写这个空白部分。最终会出现这个图表。
Attendees 1 1:03:19
아까도 다 설명드렸죠 여기다가 이제 뭐 온내도 넣고 엑스 라벨도 넣고 와이 라벨도 넣고 쇼를 하면 이제 피치 이걸로 마무리하면 되겠죠 그럼 다음과 같은 그래프가 나옵니다.
이제 레모랑 x랑 동그라미랑 어떤 거 할지 위에 보면은 이제 마커 어떻게 나타내는지 보이니까 그거 참고해서 작성해 주시면 될 것 같습니다.
그리고 저희 실습 시간은 50분까지인데 다 제출하셨으면 40분에는 나가셔도 됩니다.
질문 있으시면 제출은 그냥 3시까지 해 주셔도 상관은 없어요.
근데 이제 수업 시간이 2시 2시 50분까지입니다.
与会者 1 1:03:19 刚才我已经全部解释过了,现在在这里添加温度图,X 标签,Y 标签并显示,然后用这个来结束图表。接下来会出现以下图形。现在关于标记和 X 轴的圆圈,可以参考上面显示的标记方式来绘制。我们的实践时间是到 50 分,如果已经全部提交,可以在 40 分钟时离开。如果有问题,提交到 3 点也没关系。但是上课时间是从 2 点到 2 点 50 分。
clovanote.naver.com