在學術論著的創新性判斷中,發現新事物的存在通常具有最強的創新性,其次是揭示新事物的影響因素相關性。如果沒有存在,就談不上相關性。相關性包括因果關係和雜訊關係。因果關係(causal relationship)指的是原因與結果之間的關係。雜訊關係(noise relationship)包括非因果關係的其他影響關係。揭示“存在”問題的研究是描述性研究(descriptive research)。揭示“相關”問題的研究是相關性研究(correlation research)。當然,相關性研究也可以用來揭示新事物的“存在”。這兩種研究類型代表兩種不同的試驗研究方法,是在無法進行理論模型推導計算時所必須採用的科研方法。本文論述描述性研究與相關性研究之間的區別。 以天文學為例,發現行星的存在與研究行星運動軌跡受哪些因素影響,屬於兩種不同創新性類型的研究問題。再以醫學為例,研究某種致病原因對發病結果的影響,與研究性別(視為雜訊因子)與是否發病之間的關聯,屬於兩種不同相關性類型的研究問題。在描述性研究中,所有參數均稱為特徵參數,不存在自變量(又稱因子)和因變量(又稱回應)之間的劃分,因為描述性研究只需展示事物或其某種分佈的存在,而不關心因果關係或影響關係。然而,在相關性研究中,必須劃分因子和回應,將能夠干預改變的因子稱為控制因子(例如發動機功率),而將不能干預改變的因子稱為雜訊因子(或稱非控制因子,例如環境大氣溫度)。相關性研究包括無雜訊因子和有雜訊因子兩種。 如果沒有雜訊因子存在,當控制因子的取值發生改變時,回應參數將獲得一個確定的取值。比如,當踩下車輛的油門後,車子會加速行駛。然而,當雜訊因子存在時,回應參數的取值就不再是確定的數值,而是呈現出一條概率密度分佈函數或長條圖形式。例如,在某個固定的車輛油門開度下,由於道路上隨機變化的橫風風速的影響,車輛會呈現橫向微偏,這些微偏值也是隨機變化的,可能會呈現出一條正態分佈曲線的形式。這條正態分佈曲線具有兩個特徵量,一個稱為均值,另一個稱為偏差(散度)。當雜訊因子存在時,如果控制因子的某個取值給出一組均值和偏差,而另一個取值給出另一組均值和偏差,而且如果這兩個偏差不相等,那就構成一個穩健性問題,又稱抗擾性或魯棒性問題。穩健性問題的核心任務是找到優化的控制因子取值,使得均值最優(最大、最小或達到目標值)、散度最小——這構成一個雙目標優化問題。 如果描述性研究中的特徵參數沒有被賦予時間維度,即所有參數的取值均發生在同一時間,這種研究稱為橫斷面研究(cross-sectional study),例如研究全國人口普查的職業、年齡等分佈特徵。當描述性研究中的特徵參數被賦予時間維度時,稱為時間序列研究(time series study)或縱向研究(longitudinal study),例如研究流行病發病率隨年份變化的趨勢。 無雜訊因子的相關性研究(又稱控制性研究)需要在具有嚴格控制條件的實驗室中進行,例如改變藥物劑量,觀察經過嚴格篩選分組後的受試者的生理反應。有雜訊因子的相關性研究(又稱控制加雜訊研究)可以在不具備嚴格控制條件的實驗室中進行(例如改變藥物劑量,觀察具有不同的年齡、性別、體重、病史的受試者的生理反應),或者可以使用描述性研究資料,因為描述性研究資料中可能包括控制因子和雜訊因子,而時間就可以是一個典型的雜訊因子。當然,描述性研究資料中也可能不包括任何相關性內容,比如展示某個地區的性別比例和受教育程度的分佈資料。 描述性研究的目的是揭示新事物存在。相關性研究的目的是揭示因果關係和雜訊關係,當然也可以用來揭示新事物存在。描述性研究的資料是可以用來進行相關性研究的,只是這種資料中存在大量的雜訊因子,處理起來難度較大。從產生有價值的新發現角度評價,描述性研究和相關性研究都有其各自的難度。從收集資料的難易程度評價,描述性研究(尤其是橫斷面研究)是最容易產生試驗資料的,而無雜訊因子的相關性研究(控制性研究)是最難產生試驗資料的。 因子之間的相互作用是指回應參數隨一個因子的變化趨勢受到另一個因子的取值的影響。例如,當發動機進氣量隨轉速變化的規律受到海拔高度的影響,則稱轉速與海拔高度之間存在相互作用。揭示相互作用是系統工程研究的核心任務,也是研究複雜性影響所必須具備的內容。回應曲面方法最擅長高效處理因子相互作用。因此,它是用於相關性研究的最有效工具之一。…
9 months ago