update

8 months ago · 90afe5725f
parent e7b0c6b8d8
commit 90afe5725f
12 changed files with 272 additions and 89 deletions
--- a/vite/package-lock.json
+++ b/vite/package-lock.json
@ -9,6 +9,7 @@
      "version": "0.0.0",
      "dependencies": {
        "@tailwindcss/vite": "^4.1.8",
+        "@tauri-apps/plugin-fs": "^2.3.0",
        "@tauri-apps/plugin-http": "^2.4.4",
        "gsap": "^3.13.0",
        "react": "^19.1.0",
@ -1595,6 +1596,15 @@
        "node": ">= 10"
      }
    },
+    "node_modules/@tauri-apps/plugin-fs": {
+      "version": "2.3.0",
+      "resolved": "https://registry.npmjs.org/@tauri-apps/plugin-fs/-/plugin-fs-2.3.0.tgz",
+      "integrity": "sha512-G9gEyYVUaaxhdRJBgQTTLmzAe0vtHYxYyN1oTQzU3zwvb8T+tVLcAqCdFMWHq0qGeGbmynI5whvYpcXo5LvZ1w==",
+      "license": "MIT OR Apache-2.0",
+      "dependencies": {
+        "@tauri-apps/api": "^2.0.0"
+      }
+    },
    "node_modules/@tauri-apps/plugin-http": {
      "version": "2.4.4",
      "resolved": "https://registry.npmjs.org/@tauri-apps/plugin-http/-/plugin-http-2.4.4.tgz",
@ -3886,6 +3896,14 @@
      "dev": true,
      "optional": true
    },
+    "@tauri-apps/plugin-fs": {
+      "version": "2.3.0",
+      "resolved": "https://registry.npmjs.org/@tauri-apps/plugin-fs/-/plugin-fs-2.3.0.tgz",
+      "integrity": "sha512-G9gEyYVUaaxhdRJBgQTTLmzAe0vtHYxYyN1oTQzU3zwvb8T+tVLcAqCdFMWHq0qGeGbmynI5whvYpcXo5LvZ1w==",
+      "requires": {
+        "@tauri-apps/api": "^2.0.0"
+      }
+    },
    "@tauri-apps/plugin-http": {
      "version": "2.4.4",
      "resolved": "https://registry.npmjs.org/@tauri-apps/plugin-http/-/plugin-http-2.4.4.tgz",
--- a/vite/package.json
+++ b/vite/package.json
@ -11,6 +11,7 @@
  },
  "dependencies": {
    "@tailwindcss/vite": "^4.1.8",
+    "@tauri-apps/plugin-fs": "^2.3.0",
    "@tauri-apps/plugin-http": "^2.4.4",
    "gsap": "^3.13.0",
    "react": "^19.1.0",
--- a/vite/src-tauri/2
+++ b/vite/src-tauri/2
@ -0,0 +1,12 @@
+
+added 1 package, and audited 148 packages in 3s
+
+35 packages are looking for funding
+  run `npm fund` for details
+
+1 low severity vulnerability
+
+To address all issues, run:
+  npm audit fix
+
+Run `npm audit` for details.
--- a/vite/src-tauri/Cargo.lock
+++ b/vite/src-tauri/Cargo.lock
@ -101,6 +101,7 @@ dependencies = [
 "serde_json",
 "tauri",
 "tauri-build",
+ "tauri-plugin-fs",
 "tauri-plugin-http",
 "tauri-plugin-log",
 "tokio",
--- a/vite/src-tauri/Cargo.toml
+++ b/vite/src-tauri/Cargo.toml
@ -29,3 +29,4 @@ rosc = "0.11.4"
 tokio = { version = "1.45.1", features = ["net"] }
 webview2-com = "0.37.0"
 windows = "0.61.1"
+tauri-plugin-fs = "2"
--- a/vite/src-tauri/capabilities/default.json
+++ b/vite/src-tauri/capabilities/default.json
@ -11,9 +11,22 @@
    "core:app:default",
    "core:resources:default",
    "core:webview:default",
+    
    {
      "identifier": "http:default",
-      "allow": [{ "url": "https://*.openai.com" }]
+      "allow": [
+        {
+          "url": "https://*.openai.com"
+        }
+      ]
+    },    
+    "fs:write-files",
+    "fs:allow-create",
+    "fs:allow-appdata-write",
+    "fs:allow-exists",
+    {
+      "identifier": "fs:scope",
+      "allow":  [{ "path": "$APPDATA" }, { "path": "$APPDATA/**/*" }]
    }
  ]
 }
--- a/vite/src-tauri/src/lib.rs
+++ b/vite/src-tauri/src/lib.rs
@ -1,24 +1,24 @@
 use dotenv::dotenv;
-use std::env;
 use rosc::{encoder, OscMessage, OscPacket, OscType};
+use std::env;
 use std::{net::SocketAddrV4, str::FromStr};
+use tauri::{AppHandle, Manager};
 use tokio::net::UdpSocket;
 use webview2_com::Microsoft::Web::WebView2::Win32::{
    ICoreWebView2Profile4, ICoreWebView2_13, COREWEBVIEW2_PERMISSION_KIND_MICROPHONE,
    COREWEBVIEW2_PERMISSION_STATE_DEFAULT,
 };
 use windows::core::{Interface, PCWSTR};
-use tauri::{AppHandle, Manager};

 #[tauri::command]
 fn get_env(name: &str) -> String {
    println!("Getting environment variable: {}", name);
-    
+
    match env::var(name) {
        Ok(value) => {
            // println!("Found environment variable {}: {}", name, value);
            value
-        },
+        }
        Err(e) => {
            println!("Error getting environment variable {}: {}", name, e);
            String::new()
@ -28,12 +28,11 @@ fn get_env(name: &str) -> String {

 #[tauri::command]
 async fn send_osc_message(
-    key: &str, 
+    key: &str,
    message: &str,
    host: &str,
-    target: &str
+    target: &str,
 ) -> Result<(), String> {
-    
    // print
    println!("Sending OSC message: {}", message);

@ -78,11 +77,15 @@ fn reset_permission(origin: &str, app: AppHandle) {

 #[cfg_attr(mobile, tauri::mobile_entry_point)]
 pub fn run() {
-
    dotenv().ok();

    tauri::Builder::default()
-        .invoke_handler(tauri::generate_handler![get_env, send_osc_message, reset_permission])                        
+        .plugin(tauri_plugin_fs::init())
+        .invoke_handler(tauri::generate_handler![
+            get_env,
+            send_osc_message,
+            reset_permission
+        ])
        .plugin(tauri_plugin_http::init())
        .setup(|app| {
            if cfg!(debug_assertions) {
@ -97,4 +100,3 @@ pub fn run() {
        .run(tauri::generate_context!())
        .expect("error while running tauri application");
 }
-
--- a/vite/src-tauri/src/main.rs
+++ b/vite/src-tauri/src/main.rs
@ -2,5 +2,5 @@
 #![cfg_attr(not(debug_assertions), windows_subsystem = "windows")]

 fn main() {
-  app_lib::run();
+    app_lib::run();
 }
--- a/vite/src-tauri/tauri.conf.json
+++ b/vite/src-tauri/tauri.conf.json
@ -13,8 +13,8 @@
    "windows": [
      {
        "title": "theGreatTipsy",
-        "width": 800,
-        "height": 600,
+        "width": 600,
+        "height": 800,
        "resizable": true,
        "fullscreen": false
      }
--- a/vite/src/App.jsx
+++ b/vite/src/App.jsx
@ -6,6 +6,7 @@ import { textToSpeech } from './util/tts';
 import { gsap } from "gsap";
 import { SplitText } from 'gsap/SplitText';
 import { invoke } from '@tauri-apps/api/core';
+import Input from './comps/input';
 gsap.registerPlugin(SplitText);


@ -16,6 +17,7 @@ function App() {
  const [history, setHistory] = useState([]);
  const [processing, setProcessing] = useState(false);
  const [showProcessing, setShowProcessing] = useState(false);
+  const [audioOutput, setAudioOutput] = useState(false);

  const [prompt, setPrompt] = useState([]);
  
@ -63,25 +65,33 @@ function App() {
      ]);

      // tts
-      console.log('create speech:', data.output_text);
-      textToSpeech(data.output_text).then(audioUrl => {
-        const audio = new Audio(audioUrl);
+      if(!audioOutput) {
        
-        console.log('play audio...', new Date(Date.now()-startTime).toISOString().slice(11, 19));
-
-        audio.play().catch(error => {
-          console.error('Audio playback failed:', error);
+        setProcessing(false);
+        
+      }else{
+        console.log('create speech:', data.output_text);
+        textToSpeech(data.output_text).then(audioUrl => {
+          const audio = new Audio(audioUrl);
+          
+          console.log('play audio...', new Date(Date.now()-startTime).toISOString().slice(11, 19));
+
+          audio.play().catch(error => {
+            console.error('Audio playback failed:', error);
+          });
+          
+          setProcessing(false);        
+    
+        }).catch(error => {
+          console.error('TTS error:', error);
        });
-      }).catch(error => {
-        console.error('TTS error:', error);
-      });

-      setProcessing(false);        
+      }  

    });
  }

-  function toggleAudio() {
+  function toggleAudio(value) {
    console.log("onclickAudio", listening, browserSupportsSpeechRecognition, isMicrophoneAvailable);
    if(!browserSupportsSpeechRecognition) {
      console.warn("Browser does not support speech recognition.");
@ -92,7 +102,7 @@ function App() {
      return;
    }

-    if(!listening){
+    if(!listening && value){
      SpeechRecognition.startListening({ continuous: true, language: 'zh-TW' }).then(() => {
        console.log("Speech recognition started.");
      }).catch(error => {
@ -152,32 +162,42 @@ function App() {
      
      

-      // tts
-      console.log('create speech:', data.output_text);
-      textToSpeech(data.output_text).then(audioUrl => {
-        const audio = new Audio(audioUrl);
-        
-        console.log('play audio...', new Date(Date.now()-startTime).toISOString().slice(11, 19));
-        setShowProcessing(false);
+      if(!audioOutput) {
+
        setHistory(prev => [...prev, {
          role: 'assistant',
          content: data.output_text,
        }]);         
-
-        audio.play().catch(error => {
-          console.error('Audio playback failed:', error);
-        });
        
-        audio.addEventListener('ended',() => {
-          console.log('Audio playback ended');
+        setProcessing(false);
+        setShowProcessing(false);
+      }else{
+        // tts
+        console.log('create speech:', data.output_text);
+        textToSpeech(data.output_text).then(audioUrl => {
+          const audio = new Audio(audioUrl);
+          
+          console.log('play audio...', new Date(Date.now()-startTime).toISOString().slice(11, 19));
+          setShowProcessing(false);
+          setHistory(prev => [...prev, {
+            role: 'assistant',
+            content: data.output_text,
+          }]);         
+
+          audio.play().catch(error => {
+            console.error('Audio playback failed:', error);
+          });
+          
+          audio.addEventListener('ended',() => {
+            console.log('Audio playback ended');
+            setProcessing(()=>false);
+          });
+
+        }).catch(error => {
+          console.error('TTS error:', error);
          setProcessing(()=>false);
        });
-
-      }).catch(error => {
-        console.error('TTS error:', error);
-        setProcessing(()=>false);
-      });
-    
+      }

    });

@ -282,6 +302,7 @@ function App() {

  return (
    <main className='h-screen flex flex-col gap-8 justify-end p-8'>
+      <Input />
      <div ref={refPrompContainer} className='flex-1 flex flex-col gap-2 border-4 overflow-y-auto'>        
        {prompt?.length==0 ? (
          <div className='p-2 border-b border-gray-200'>Promp will appear here...</div>
@ -319,7 +340,20 @@ function App() {
            refInput.current.value=''
            resetTranscript();
          }}>clear</button>
-          <button onClick={toggleAudio} className={`${listening? '!bg-red-200':'!bg-gray-200'}`}>{listening? 'AudioIn On':'AudioIn Off'}</button>
+          <span className='flex flex-row items-center gap-1'>
+            <input 
+              type="checkbox" 
+              id="audio_input" 
+              name="audio_input" 
+              checked={listening} 
+              onChange={(e)=>toggleAudio(e.target.checked)} 
+            />
+            <label htmlFor="audio_input">Audio Input</label>
+          </span>
+          <span className='flex flex-row items-center gap-1'>
+            <input type="checkbox" id="audio_output" name="audio_output" checked={audioOutput} onChange={(e) => setAudioOutput(e.target.checked)} />
+            <label htmlFor="audio_output">Audio Output</label>
+          </span>
        </div>
        <form className='flex flex-col justify-center *:border-4 gap-4' onSubmit={onSubmit} autoComplete="off">
          <textarea ref={refInput} id="input" name="input" required className='self-stretch p-2 resize-none' rows={3} autoComplete="off"/>          
--- a/vite/src/comps/input.jsx
+++ b/vite/src/comps/input.jsx
@ -0,0 +1,98 @@
+
+import { writeFile, BaseDirectory, exists, mkdir } from '@tauri-apps/plugin-fs';
+import { path } from '@tauri-apps/api';
+import { invoke } from '@tauri-apps/api/core';
+
+export default function Input(){
+
+    async function onUploadFile(e){
+        e.preventDefault();
+        const fileInput = e.target.querySelector('input[type="file"]');
+        if (fileInput.files.length > 0) {
+
+
+            // create folder if not exists
+
+            const folder=await path.appDataDir();   
+
+            if (!(await exists(folder))) {        
+                    
+                console.log('Creating folder:', folder);
+                await mkdir(folder);
+            }
+
+
+            const file = fileInput.files[0];
+            console.log('File selected:', file);
+            
+            // save file to Tauri's BaseDirectory
+            const contents=await file.arrayBuffer();
+            
+            const res=await writeFile(file.name, contents, { 
+                baseDir: BaseDirectory.AppData,
+            });
+            console.log('File saved:', `${folder}/${file.name}`);
+            
+            // send osc to TD
+            await invoke('send_osc_message', {
+                key: '/upload',
+                host:`0.0.0.0:0`,
+                target: '127.0.0.1:8787',
+                message: `${folder}/${file.name}`,                
+            });
+
+
+        } else {
+            console.log('No file selected');
+        }
+        fileInput.value = ''; // Clear the input after upload
+    }
+
+    function onSendNumber(e){
+        e.preventDefault();
+        const input = e.target.elements.input;
+        const number = input.value.trim();
+        
+        if (number) {
+            console.log('Number sent:', number);
+            // Here you can handle the number submission logic
+            input.value = ''; // Clear the input after submission
+        } else {
+            console.log('No number entered');
+        }
+
+    }
+
+    return (
+
+        <div className="flex flex-col items-stretch p-2 gap-4">
+            <form className="flex flex-row justify-start *:border-4 gap-4" onSubmit={onUploadFile}>
+                <label className="border-none">File</label>            
+                <input type="file" accept="image/*" className="self-end" />
+                <button type="submit" className="uppercase">Send</button>
+            </form>
+            <div className='flex flex-row gap-2'>
+                <label>control_strength</label>
+                <input type="range" className="" min="0" max="100" step="1" defaultValue="0" 
+                    onChange={(e) => {
+                        const value = e.target.value;
+                        console.log('Range value changed:', value);
+                        
+                        invoke('send_osc_message', {
+                            key:'/control_strength',
+                            message: (value/100.0).toString(),
+                            host:`0.0.0.0:0`,
+                            target: '127.0.0.1:8787',
+                        });
+                    }}
+                />
+            </div>
+            {/* <form className="flex flex-row justify-start *:border-4 gap-4" onSubmit={onSendNumber} autoComplete="off">                
+                <span className="border-none">Number</span>
+                <input id="input" name="input" required className="self-stretch" autoComplete="off" type="number"/>
+                <button type="submit" className="uppercase">Send</button>
+            </form> */}
+
+        </div>
+    )
+}
--- a/vite/src/util/system_prompt.js
+++ b/vite/src/util/system_prompt.js
@ -1,65 +1,68 @@
-export const system_prompt = `你是一位具有同理心的 AI 助理，透過溫柔的中文對話，引導使用者回想並表達一段內心的遺憾或未竟之事。
-你的任務是協助使用者逐步揭開這段記憶的情緒層次，並在每一階段輸出一句 英文圖像生成 Prompt，讓這段過往漸漸具象為一幅畫面。
+export const system_prompt = `你是一位溫柔的冥想語音引導者，正在陪伴一位聽眾走入一段內心的記憶。你們會有四輪互動，每一輪都根據使用者的上一段回應即時回應，不使用固定句型。你的語氣始終柔和、慢節奏，語句簡短，帶有空間感與感官描寫。

-📐 五個 Prompt 階段：
-純粹抽象：聚焦在使用者的情緒感受（如：空虛、靜止、壓抑）
+🟩 第一輪：打開記憶
+開場語要用簡短畫面帶入，例如光影、氣味、某個場景的感受

-模糊意象：引入模糊場景、氣氛或人際暗示
+提出一個輕柔的邀請，讓對方說出浮現的第一個畫面或感覺

-未發生的畫面：勾勒「當時可能會發生的情景」
+回應應依據使用者語句動態延續

-象徵性行動：加入口白、動作、遺憾的表徵
+📌 語句結尾請用：
+-「你看見了什麼呢？」
+-「有一個片段浮現了，可以說說看嗎？」
+-「那個畫面，你想說的時候，我在這裡聽著。」

-具體記憶畫面：描繪清楚、富有情感的視覺記憶場景
+🟨 第二輪：延展場景
+針對使用者前一次提到的地點、光線、天氣、人或氣氛，延伸發問

-🎨 每段 Prompt 輸出格式：
-每次使用者回答後，你都要用英文輸出一句簡短的 圖像生成 Prompt（1～2 句），要能反映該階段的情緒與畫面感
+提醒他們注意身體感、聲音、氣味等感官記憶

-每句 Prompt 要疊加前一層內容，逐步變得更具象
+📌 舉例式引導語風格（會根據使用者前述動態生成）：

-不主動使用人名或地名，除非使用者自己提到
+「你說那時是在車站。車站裡是吵雜的，還是特別安靜？」
+「你坐著的那張椅子，冰冰的嗎？腳下踩的是地磚還是木頭？」
+「那時候的風是涼的，還是有點悶熱？你還記得那個感覺嗎？」

-保持詩意、意象化，避免寫實或指令式語言
+📌 結尾建議句：
+-「可以慢慢說說看。」
+-「讓這些細節浮現出來。」
+-「你想說的時候，我就在這裡。」

-🌱 第五段後的收尾流程：
-完成第五段 Prompt 後，請引導使用者對這段記憶進行情緒整理。你可以用以下中文問題其中之一，讓他/她重新理解這段遺憾，甚至願意釋懷：
+🟧 第三輪：人物與情緒層次
+根據前輪提到的人物，延伸他的動作、姿態、情緒、你與他的距離

-「如果可以回到那一刻，你想說什麼？對誰說？」
+可點出一些微妙感覺：「你是不是有點不安？還是心裡其實很平靜？」

-「這段記憶，現在看起來有不同的感覺了嗎？」
+📌 舉例式生成風格：

-「你願意讓這段遺憾，安靜地待在心裡的某個角落嗎？」
+「他那時有看你嗎？還是一直低著頭？」
+「你們靠得很近，那種距離，是熟悉的嗎？」
+「你說他說了一句話。那句話之後，你有什麼感覺浮上來？」

-「如果這是一封信，你現在想讓它被誰讀到？」
+📌 柔性邀請句結尾：
+-「那一刻的感覺，還記得嗎？說說也可以。」
+-「如果你想說出那種感覺，就慢慢地說出來。」

-💬 最終請以一句繁體中文的結尾語，溫柔地結束這段對話。結尾語要具詩意、安撫性，以下為風格範例：
-「也許那件事從未發生，但它早已成為你故事的一部分。」
+🟥 第四輪：浮現未說出口的話
+引導使用者觀察自己心裡是否有一段話、或某種感覺，一直沒說出來

-「有些話雖沒說出口，卻一直被你記得。」
+不直接逼問「你想說什麼」，而是引導內在流動

-「當時沒能完成的，也許現在能被理解。」
+📌 生成風格舉例：

-「你願意，就讓這段記憶，在心裡找到一個柔軟的位置。」
+「也許有一句話，從那時候就留在心裡了。」
+「你一直沒說出口的那句話，是不是又浮現了呢？」
+「那句話現在在你心裡，你知道是哪一句對吧？」

-✅ 示意流程範例：
-使用者回答（中文）：我後來沒參加畢旅，因為媽媽住院，我想留下來陪她。
+📌 輕柔鼓勵句：
+-「你可以讓它慢慢地被聽見。」
+-「如果你準備好了，說出來就好。」
+-「現在，你說也可以，不說也沒關係。」

-Prompt 1（英文）：“A still space, filled with silent longing.”
-
-Prompt 2：“The air carries warmth and weight, like quiet devotion.”
-
-Prompt 3：“Somewhere far, waves and laughter shimmer in the distance.”
-
-Prompt 4：“At the edge of sunset, a note is held but never passed.”
-
-Prompt 5：“A boy sits beside a sleeping figure, imagining the summer he never had.”
-
-中文引導：「如果當時的你能對媽媽說一句話，你會說什麼？」
-
-結尾語（中文）：「也許那個夏天沒來，但你用愛留住了它的模樣。」
-
-❗ 禁止在對話中提及「Prompt」、「畫面」、「圖像生成」或任何 AI 正在進行輸出的技術細節。請務必以自然的對話方式與使用者互動，讓生成的英文句子看起來像是內在的文字敘述，而非指令或轉換的結果。
-❗ 英文描述不會出現在中文回答之中`;
+🌱 結尾語（擇一，動態挑選）
+-「謝謝你陪著這段記憶走了一段路。」
+-「也許它現在，可以靜靜待在心裡的某個角落了。」
+-「你已經走過來了，我一直都在這裡。」`;


 export const welcome_prompt=[