ChatGPT4.0 x Streamlit x Hugging Face 生成式 AI 商品價格爬取分析專業實戰課 ( 進階 )
什麼是 Hugging Face?模型庫四大領域:自然語言處理、音檔處理、電腦視覺處理、多模態模型處理
Hugging Face是開源模型集散地,整合大量的模型、資料集。然而 Hugging Face 不單純是把模型放在網站上讓人下載,更重要的是提供標準化的函式庫、API 與網頁介面,並建立起開源社群。不僅讓用戶自主創建AI模型,並將其儲存平台內。該平台不僅可以添加資料訊息、上傳公司隱密文件、追蹤版本更新等操作,更可以讓開發者自行採用模型加以訓練與測試。這些模型涵蓋不同領域,例如自然語言處理、音檔處理、電腦視覺處理、多模態模型處理。對於開發者或AI工程師而言,Hugging Face 不僅是一個模型訓練平台,也可以和其他 NLP 工具集成,如 PyTorch、TensorFlow 和 JAX, 從傳統的後端開發和算法研究,逐漸轉向更多涉及前端交互、用戶體驗設計以及跨部門溝通,提高工作效率,能夠專注創新與開發階段。
以Streamlit 構築使用者介面?從小工具、資料顯示到使用者輸入
如何把建立的網頁框架設計成使用者互動式的操作,進行抓取數據進行視覺化,從而更方便地進行商品價格的分析?Streamlit便是不可或缺的AI工具之一,Streamlit提供可以用來構建使用者介面的 UI 元素,UI元素以小工具(Widgets)的形式呈現。例如,HTML 中的 <h1> 標籤,或是使用Markdown 語法,將函式字串輸入在網頁上。因此,隨著生程式AI技術進步,無論是自然語言處理和電腦視覺,都逐漸整合到Streamlit 之中,使得介面設計更具智慧與直觀。讓使用者即時看到資料及結果變化,進一步提升互動性和動態效率。
AI工具幫助非程式專業背景者如何獲取市場反饋?
在內部組織裡,AI 程式工程師非常需要與非技術部門合作,包含市場、產品和管理團隊,透過使用Streamlit技術,快速創建出易於理解和操作的應用。簡言之,在數據驅動的決策過程中,將複雜的數據和分析結果以直觀的方式呈現給決策者極為重要。Streamlit在數據可視化方面的優勢使其成為展示數據洞察的理想工具。因此,透過生成式AI技術,企業可以客製化開發專屬的商品爬蟲數據平台,這個平台能夠根據企業的特定需求來定制化數據收集和分析功能。這不僅提高了數據的相關性和實用性,還能讓企業更好地應對市場的快速變化!
課程的三大重點
透過爬蟲技術,行銷團隊可以即時收集競爭對手的產品價格和市場趨勢
本課程第一大重點,將全面提升學員的Python網路爬蟲技術。利用網址爬蟲功能追蹤競爭對手的網站,蒐集市場趨勢、產品資訊與價格分布等資訊,例如,當競品推出新品時,如何透過爬取競業網站,獲取新品細節?利用AI與自家產品進行比較,生成產出競品分析報告,大幅減少傳統產品分析時間。業師將從課程中引導學習如何即時性的資訊收集,快速掌握市場動態,並根據最新情況調整策略,保持競爭優勢。
自動化地從電商平台上收集商品價格數據,大幅減少人工收集所需的時間和成本
在本課程第二大重點中,將進一步學習兩大AI工具「ChatGPT 4.0 」與「code copilot」。並學習導入提示工程於軟體開發實務中,如何獲得關鍵Source Code非常重要,因此課程中將提供設計的爬蟲提示語,以及改寫成動態網頁框架的方法,幫助學員快速進行軟體開發實作。
結合實戰案例解析,打造動態網頁框架與部署平台實作
在本課程的最後一大重點中,業師以兩大電商平台進行演示。包含爬蟲模組 BeautifulSoup 與 Requests 的基礎介紹,對於商品名稱與價格抓取和儲存;另一個則是運用網頁前端框架改版說明與Post的應用,進行數據分析與視覺化。課程中,也會教學生成式工具打Streamlit動態網頁框架,例如使用ChatGPT4.0將關鍵字合併改寫爬蟲程式。同時部署Streamlit框架到 Hugging Face進行判讀除錯記錄檔,並執行自動化爬蟲商品系統平台。
課程大綱
生成式AI技術和開發環境IDE介紹
在軟體應用上,生成式AI已經被廣泛運用在很多領域。此處介紹常見的兩大AI生成工具將有助於開發者在極短的時間內改寫爬蟲的source code和建立動態的框架。而本課程將介紹生成式工具搭配建議的開發套件進行實作,將有助學習者快速產生客製化的線上系統。
1-1 ChatGPT-4.0 介紹
1-2 Code Copilot 的功能和使用方法
1-3 Claude AI sonet 3.5 介紹
1-4 Artifacts 的應用和操作
1-5 Google Colaboratory 介紹
提示工程在軟體開發中的導入
在目前的軟體開發實務上,如何透過關鍵的提示語來獲得關鍵的Source code非常重要,因此本課程在此處提供設計的爬蟲提示語以及改寫成動態網頁框架的方法,將有助於學員快速進行軟體的開發和實作。
2-1 提示工程在軟體開發中的步驟
2-2 常見的提示語設計
2-3 如何在開發流程中應用提示工程
PChome商品價格爬蟲實戰與分析範例
Pchome線上購物平台提供各類商品,包括電子產品、家居用品、服飾、美妝、食品等,並且以其快速的物流服務和穩定的線上消費系統而聞名。PChome 的網站設計簡單易用,並且有多種付款方式,由於其上架商品的多樣性的原因,使得我們可以針對不同產品的價格進行捕捉和分析。
3-1 爬蟲模組BeautifulSoup 與 Requests 的基礎介紹
3-2 Pchome爬蟲程式說明與介紹
3-3 Pchome商品名稱和價格抓取和儲存
3-4 Pchome數據分析與視覺化
MOMO商品價格爬蟲實戰與分析範例
MOMO是台灣一家主要的線上購物平台,提供多樣化的商品選擇,包括電子產品、家電、服飾、日用品、美妝等,並且以其價格競爭力和頻繁的促銷活動吸引大量消費者。MOMO 以便利的購物體驗、快速配送服務以及多元的付款方式著稱;也因其生活用品的多元,這將有助於針對不同展品的價格進行探勘。
4-1 MOMO網頁前端框架改版說明與post的應用
4-2 MOMO爬蟲程式說明與介紹
4-3 MOMO商品名稱和價格抓取和儲存
4-4 MOMO數據分析與視覺化
生成式工具打造Streamlit動態網頁框架
Streamlit 特別適合用呈現數據分析的結果。開發者可以快速搭建一個互動式的網頁應用,分享給團隊成員或客戶,無需配置繁瑣的網頁開發環境。而Streamlit動態網頁框架在數據圖表的繪製上非常精緻和美觀,這將有助快速理解同質性產品在不同平台的競價分析。
5-1 Streamlit動態網頁框架介紹
5-2 chatGPT4.0改寫Pchome爬蟲程式為Streamlit動態網頁框架程式
5-3 chatGPT4.0改寫MOMO爬蟲程式為Streamlit動態網頁框架程式
5-4 整合Pchome和MOMO 改寫後的Streamlit動態網頁框架程式
5-5 使用ChatGPT將關鍵字和爬取頁數抽取改寫
部署Streamlit框架到 Hugging Face 平台實作
Hugging Face 是一家專注於自然語言處理(NLP)和機器學習的人工智慧公司,本節則是實作將開發好的Streamlit爬蟲程式部署到該平台的空間,透過該平台提供的執行環境使其開發的爬蟲自動化數據分析平台可以在克服在不同作業系統環境進行線上的操作和互動。
6-1 平台特點和主要功能
6-2 帳號註冊和建立個人平台
6-3 部署開發程式為app.py以及上傳requirements.txt
6-4 如何判讀錯誤記錄檔以及使用chatGPT進行除錯
6-5 部署成功以及執行自動化爬蟲商品系統平台
課程學習前須知
- 實際授課內容、順序、師資或有調整,依課程現場為準。
加入我們一起學習 ChatGPT4.0 x Streamlit x Hugging Face 生成式 AI 商品價格爬取分析專業實戰課 ( 進階 )
授課業師
黃朝健 業師
業師早年投注於觸控IC和觸控模組的研發,從人因的互動設計開始進入科技業,以醫療影像的研究為主,返台後協助大型製造業進行智慧製造轉型。負責過無人機影像辨識專案、醫療影像辨識、高齡跌倒專案、國道交通事故排除預測系統等專案。業師受邀擔任教育部部定講師、聯成電腦(Python、機器學習、深度學習)講師、勞動部雲嘉南分署大數據講師、勞動部產業人才投資方案課程(Python、電商行銷、數據科學)講師、數發部產業發展署(AI GO講師生成對抗網路、AI GO講師Kaggle 數據平台實戰),以及國立政治大學電算中心擔任技術師,具豐富業界落地實務經驗。
《業師著作》
AI時代的資料科學:小白到數據專家的全面指南 ISBN:9786267383926
課程資訊
課程名稱
ChatGPT4.0 x Streamlit x Hugging Face 生成式 AI 商品價格爬取分析專業實戰課 ( 進階 )(C1513)
課程各期時間與上課模式
#線上預錄
。上課模式:線上錄製影片
。觀看方式:訂單完成隔日工作日開始觀看(信內附上影片連結,未收到Email,請務必與我們聯繫)
。觀看時間:依購買天數方案,自「觀看通知Email」寄送日起算第一天。
課程售票
一般推廣票:每人 4,650 元(原價7,200 元)
雙人以上團報票:每人新台幣 3,800 元(原價 超優惠 5.3折)
VIP票券兌換:每人扣 1 張VIP票券 ( VIP申購方案 )
課前搶先問
Streamlit 是一個開源框架,專為機器學習和數據科學領域開發網頁應用程式。
Streamlit讓開發者只需要寫很少的程式碼就可以做出很棒的功能。它提供了很多工具和功能,比如scrollbar拉桿、按鈕和圖表,讓開發者可以很容易地加入不同的元素。
Streamlit 是專為快速製作數據視覺化儀表板而設計的工具。這個工具的目的是讓前後端的程式碼的編寫變得更簡單,讓軟體工程師可以快速建立互動性高的應用程式。Streamlit 支援各種互動式元件,比如scrollbar拉桿、按鈕和圖表,使得即使不擅長前端開發的工程師也能輕鬆建立功能豐富的應用程式。
在快節奏的企業環境中,開發效率至關重要。Streamlit和Gradio的高效性能和簡便的使用方式,使得AI工程師可以在較短的時間內完成更多的工作,從而快速響應市場和業務的需求。
最大亮點是開源模型集散地,整合大量的模型、資料集。然而 Hugging Face 不單純是把模型放在網站上讓人下載,更重要的是提供標準化的函式庫、API 與網頁介面,並建立起開源社群。
在 Hugging Face 上可以輕鬆找到各種模型與資料集,並開放原始碼,任何人都可以使用。頁面可依照「趨勢」排序,快速找到目前流行的模型。如有特定需求,也可以使用預先訓練好的模型再進行微調(fine tune)。特別是訓練起來很昂貴的語言模型,不需要從頭訓練,可大量節省開發成本。
Hugging Face 上大多數的服務都是免費的。不過開發者可以訂閱年費,提早使用新功能與更強大的 Inference API(如:支援 streaming、可傳入更多參數)。若要使用 Spaces 的硬體或 Inference Endpoint(用於 production 的 API),則採按時計價。