Fastighetsvärdering med hjälp av regressionsanalys

ETFFIN >> Privatekonomi > >> Finanshantering >> Företagsfinansiering

Fastighetsvärdering med hjälp av regressionsanalys – en handledning

Sammanfattning

Regressionsanalys erbjuder en mer vetenskaplig metod för fastighetsvärdering

Traditionellt finns det tre metoder för att värdera fastigheter:jämförbar försäljning, inkomst och kostnad.
Regressionsmodeller ger ett alternativ som är mer flexibelt och objektivt. Det är också en process som när en modell väl har skapats blir autonom, vilket gör det möjligt för fastighetsentreprenörer att fokusera på sina kärnkompetenser.
En modell kan byggas med många variabler som testas för inverkan på värdet på en fastighet, till exempel kvadratmeter och antalet sovrum.
Regressioner är inte en magisk kula. Det finns alltid en fara att variabler innehåller autokorrelation och/eller multikollinearitet, eller att korrelation mellan variabler är falsk.

Exempel:bygga en regressionsvärderingsmodell för Allegheny County, Pennsylvania

Det finns en uppsjö av fastighetsinformation som kan nås elektroniskt för inmatning i modeller. Statliga myndigheter, professionella dataleverantörer och Multiple Listing Services är tre sådana källor.
Initiala datadumpar kräver viss rengöring för att säkerställa att det inte finns några oregelbundna uppsättningar information. Till exempel, i vårt urval, togs hus som överfördes som gåvor bort, för att inte förvränga resultatet av verkligt marknadsvärde.
Med ett slumpmässigt urval från 10 % av data returnerade SPSS följande fem variabler som mest prediktiva för fastighetsvärde:
- Betyg baserat på konstruktionens kvalitet rankad 1-19 (1=Mycket dålig och 19=Utmärkt)
- Färdigt vardagsrum
- Luftkonditionering (Ja/Nej)
- Loggstorlek
- Betyg för fysisk kondition eller reparationsstatus rankad 1-8
Det är viktigt att testa resultaten, med Durbin-Watson-testet som används för autokorrelation och Breusch-Pagan-testet för heteroskedasticitet. I vår modell fanns det små heteroskedastiska tendenser, vilket indikerar att variabiliteten för vissa variabler var ojämn över hela värdeintervallet.

Kan regressionsbaserad fastighetsanalys vara användbar för ditt företag?

Bortsett från att värdera fastigheter kan regressionsanalys inom fastigheter vara särskilt fördelaktigt inom andra områden:
- Test ger resultat från tidigare affärer
- Prisanalys för listpriser och hyrespriser
- Demografisk och psykografisk analys av bostadsköpare och hyresgäster
- Identifiera mål för direktmarknadsföring
- ROI-analys för marknadsföringskampanjer
Dessutom, när du bedömer kandidater för att bygga regressionsmodeller, var försiktig med dem som lovar världen från dag ett. Att bygga en robust regressionsmodell är en iterativ process, så fokusera istället på dem som är naturligt nyfikna och kan tänka på plats (d.v.s. kan svara brainteasers med en tankeprocess).

Alltför ofta i fastigheter kan värderingsprocessen uppfattas som en tumsugande övning med hög panna. Mäklaren kommer över, sparkar de ökända däcken och producerar sedan ett uppskattat värde med mycket liten "kvantitativ" insikt. Kanske förvärras processen av den känslomässiga fäste som ägandet av fastigheter medför, eftersom ett hus för många kommer att vara den största finansiella investeringen som gjorts under en livstid.

Ändå finns det en metod för denna galenskap. Tja, tre för att vara exakt.

Hur värderas egendom?

Den jämförbara försäljningsmetoden är vanligast i bostadsfastigheter och använder nyligen genomförda försäljningar av liknande fastigheter för att fastställa värdet på en aktuell fastighet. Försäljningspriset för "komps" justeras baserat på skillnader mellan dem och den aktuella fastigheten. Till exempel, om en jämförbar fastighet har ett extra badrum, dras det uppskattade värdet av badrummet från dess observerade försäljningspris.

Kommersiella fastigheter anses vara mer heterogena, så den jämförbara försäljningsmetoden används mer sällan. Inkomstmetoden, baserad på konceptet att det inneboende värdet av en tillgång är ekvivalent med summan av alla dess diskonterade kassaflöden, tillämpas mer allmänt på två metoder:

I likhet med nuvärdet av en livränta använder metoden för direkt kapitalisering en fastighets nettodriftsintäkter (NOI) dividerat med "cap rate" för att fastställa ett värde. Takräntan innehåller en underförstådd diskonteringsränta och framtida tillväxttakt av driftsöverskottet.
Den diskonterade kassaflödesmetoden ger nuvärdet av framtida kassaflöden under en viss tidsperiod, med ett terminalvärde som uppskattas med hjälp av en terminal cap rate.

Den sista tekniken är kostnadsmetoden, som uppskattar värdet baserat på kostnaden för att förvärva en identisk bit mark och bygga en kopia av den aktuella fastigheten. Därefter skrivs kostnaden för projektet av baserat på aktuellt inkuransläge för den aktuella fastigheten. I likhet med justeringarna i det jämförbara försäljningssättet är målet att nära matcha den aktuella fastigheten. Kostnadsmetoden används mer sällan än de andra två metoderna.

Alla traditionella fastighetsvärderingsmetoder är subjektiva, på grund av urvalet av de indata som används för värderingen. Till exempel, valet av takränta har en betydande inverkan på en fastighetsvärdering:när man värderar en fastighet med ett NOI på 1 miljoner USD kommer en ökning med 4 % i takräntan (från 6 % till 10 %) att minska värdet på fastigheten med 40 % (diagram nedan).

Fördelar med att använda regressionsmodeller vid fastighetsvärdering

Det finns många fördelar med att använda regressionsmodeller för fastighetsvärdering. Detaljhandeln har anammat dess användning för platsval, men fastighetsbranschen har för det mesta förbisett dess potentiella fördelar. Regressionsanalys är särskilt lämplig för att analysera stora mängder data. Det skulle vara praktiskt taget omöjligt att ha en stark kunskap om alla lokala fastighetsmarknader i landet, men regressionsmodellering kan hjälpa till att begränsa sökningen.

1. Flexibilitet

Den största fördelen med att använda regressionsmodellering är dess inneboende flexibilitet - de kan fungera oberoende av andra modeller eller tillsammans med dem.

Det mest direkta tillvägagångssättet är att använda befintliga försäljningsdata för att förutsäga värdet på en föremålsfastighet, som en output till modellen. Det finns många källor till gratis data från lokala, statliga och federala myndigheter som kan kompletteras med privata dataleverantörer.

Ett annat alternativ är att använda regressionsmodeller för att mer exakt förutsäga indata för andra traditionella värderingsmetoder. Till exempel, när man analyserar ett kommersiellt projekt med blandad användning, kan en utvecklare bygga en modell för att förutsäga försäljningen per kvadratfot för butiksytan och en annan modell för att förutsäga hyrespriser för bostadskomponenten. Båda dessa skulle sedan kunna användas som en input till en inkomstmetod för värdering.

2. Objektiv strategi

Att använda sunda statistiska principer ger ett mer objektivt förhållningssätt till värdering. Det är ett av de bästa sätten att undvika bekräftelsebias, som uppstår när människor söker information som bekräftar deras befintliga åsikt eller avvisar ny information som motsäger den. När jag har byggt modeller för återförsäljare för att förutsäga ny butiksförsäljning, blev de ofta förvånade över att få veta att många återförsäljare tjänar på att vara nära en konkurrent. Faktum är att samlokalisering med Walmart, som ofta var deras största konkurrent, en av de vanligaste variablerna som användes i mina modeller. Att förlita sig på befintliga fördomar kan leda till missade möjligheter, eller ännu värre, dölja katastrofer precis runt hörnet.

Några av de objektiva fördelarna med statistisk värdering är följande:

Med statistisk analys kan du bestämma den statistiska signifikansen (tillförlitligheten) för enskilda faktorer i modellen.
Medan scenario- eller känslighetsanalys kan ge dig en allmän uppfattning om ändringar av indata i mer traditionella metoder, är det mer besläktat med att göra flera förutsägelser snarare än att ge dig en bättre uppfattning om exaktheten i den ursprungliga förutsägelsen. Å andra sidan, när du bygger en regressionsmodell, kommer du att veta vad resultatomfånget kommer att vara baserat på en viss nivå av förtroende.

Regressionsmodeller är unika genom att de har en inbyggd kontroll för noggrannhet. Efter att ha byggt en modell på ett urval av den totala populationen kan du använda modellen på data utanför urvalet för att upptäcka möjliga provtagningsbiasar.

3. Håll dig till din kärnkompetens

Traditionella värderingsmetoder har alla en betydande risk för urvalsbias. När du väljer jämförbara egenskaper är det mycket lätt att falla i fällan att välja de bästa resultaten och anta att de liknar ditt projekt mest. Det finns också en betoning på att förutsäga variabler, såsom avkastningen i inkomstsynen. Att eliminera behovet av denna förutsägelse kan vara attraktivt för många fastighetsinvesterare, varför regressionsbaserad värdering är ett användbart tillvägagångssätt.

Möjliga problem med regressionsanalys

Mängden skämt som citerar de olika procentsatserna av statistik som består av är verkligen ett skämt i sig. Vi bombarderas nästan varje dag med mediarubriker om resultaten av en ny forskningsstudie, av vilka många verkar motsäga en studie som publicerades förra året. I en värld av soundbites finns det ingen tid att diskutera rigorösheten i de metoder som forskarna använder.

Det finns många typer av regressionsanalys, men den vanligaste är linjär regression. Det finns vissa antaganden om linjära regressioner som inte bör kränkas för att anse modellen som giltig. Att bryta mot dessa antaganden förvränger statistiska tester som beräknar den prediktiva kraften hos indata och den övergripande modellen.

Antaganden om linjär regression

Det bör finnas ett linjärt samband mellan indata (oberoende variabler) och output (beroende variabel). Till exempel skulle vi kunna anta att det finns ett linjärt samband mellan de uppvärmda kvadratmeterna i ett hem och dess totala värde. Men på grund av minskande avkastning kan vi upptäcka att förhållandet är icke-linjärt, vilket kräver en omvandling av rådata.

De oberoende variablerna ska inte vara slumpmässiga. Enkelt uttryckt är observationerna för varje oberoende variabel i modellen fasta och antas inte ha något fel i deras mätning. Om vi till exempel använder antalet enheter för att modellera värdet på ett hyreshus, kommer alla byggnader i våra exempeldata att ha ett fast antal enheter som inte kommer att förändras, oavsett hur vi bygger modellen.

Modellens "rester" (d.v.s. skillnaden mellan modellens förutsagda resultat och faktiska observationer) kommer att summeras till 0, eller i enklare termer:modellen vi kommer att använda kommer att representera linjen för bästa passform.

Modellen ska vara korrekt för alla observationer för varje oberoende variabel. Om vi förutspådde värdet på ett hem baserat på dess kvadratmeter, skulle vi inte vilja använda modellen om den var extremt noggrann för att förutsäga värden för hus under 1 500 kvadratmeter, men det fanns en stor mängd fel för hem över 3 000 kvadratfot. Detta är känt som heteroskedasticitet.

Ett av de vanligaste problemen med linjär regression när man tittar på fastighetsbranschen är en korrelation av kvarvarande fel mellan observationer. Du kan tänka på detta som vitt brus som inte har något mönster. Men om det finns ett mönster för resterna behöver vi troligen göra en justering. Det här problemet är svårt att föreställa sig, men det finns två huvudområden där detta är ett problem inom fastighetsbranschen.

1. Autokorrelation

Att bygga en modell baserad på observationer över en lång tidsperiod skulle vara olämpligt för att förutsäga aktuella värden. Anta att vi byggde en modell för att förutsäga värdet på en hotellfastighet med hjälp av den genomsnittliga rumspriset som en oberoende variabel. Den prediktiva kraften hos denna variabel kan vara missvisande eftersom rumspriserna har stigit konsekvent över tiden. I statistiska termer finns det en autokorrelation mellan observerade genomsnittliga rumspriser som visar en positiv trend över tid (dvs inflation) som inte skulle tas med i modellen. Den traditionella jämförbara försäljningsmetoden som används mest i bostadsfastigheter eliminerar detta problem genom att endast använda de senaste uppgifterna. Eftersom det finns mycket färre antal kommersiella transaktioner, gör denna tidsbegränsning ofta den jämförbara försäljningsstrategin ineffektiv. Det finns dock tekniker som använder linjär regression som kan övervinna problemen med autokorrelation.

Klustereffekten är också en betydande utmaning vid modellering av fastighetsvärdering. Detta kan ses som rumslig autokorrelation. Det enklaste sättet att tänka på detta problem är att föreställa sig att bygga en modell för att förutsäga värdet av hus i två stadsdelar (A och B) på vardera sidan om en motorväg. Som helhet kan modellen fungera bra för att förutsäga värden, men när vi undersöker de kvarvarande felen märker vi att det finns ett mönster. Husen i stadsdel A är i allmänhet cirka 10 % övervärderade och husen i stadsdel B är ungefär 10 % undervärderade. För att förbättra vår modell måste vi ta hänsyn till denna klustereffekt eller bygga en modell för varje stadsdel.

2. Multikollinearitet

Idealt sett kommer variabler inom en modell inte att vara korrelerade med varandra. Detta kända problem kallas multikollinearitet. Att använda både kvadratfot och antalet parkeringsplatser som input till en modell som värderar regionala gallerior skulle sannolikt visa multikollinearitet. Detta är intuitivt eftersom planeringskoder ofta kräver ett visst antal parkeringsplatser baserat på kvadratmeterantalet på en kommersiell plats. I det här exemplet skulle en borttagning av en av variablerna ge en mer exakt bedömning av den justerade modellen utan att dess prediktiva kraft avsevärt minskas.

Övriga överväganden

Att använda observerade data är kärnan i alla empiriska metoder, men det är viktigt att komma ihåg att tidigare resultat inte alltid förutsäger framtiden. Illikvida tillgångar som fastigheter är särskilt känsliga för förändringar i konjunkturcykeln. Prediktivkraften för vissa variabler kommer sannolikt att förändras baserat på nuvarande ekonomiska förhållanden. Detta problem är inte unikt för linjär regression och finns även med traditionella metoder.

Korrelation är inte lika med orsakssamband. Syftet med modellbyggande är att hitta användbara variabler som gör giltiga förutsägelser. Du måste vara försiktig med falska samband. Du kanske blir förvånad över att höra att det finns en extremt stark korrelation mellan skilsmässofrekvensen i Maine och per capita konsumtion av margarin. Men att använda skilsmässodata från Maine skulle inte vara meningsfullt om du försökte förutsäga framtida margarinförsäljning.

Ett verkligt exempel på fastighetsvärdering via regression

Låt oss nu tillämpa denna kunskap praktiskt och bygga en linjär modell från början till slut. För vårt exempel kommer vi att försöka bygga en fastighetsvärderingsmodell som förutsäger värdet av enfamiljshus i Alleghany County, Pennsylvania. Valet av Alleghany County är godtyckligt, och de rektorer som visas kommer att fungera för vilken plats som helst. Vi kommer att använda Excel och SPSS, som är en vanlig statistisk programvara.

Hitta data

Att hitta kvalitetsdata är det första steget i att bygga en korrekt modell och kanske det viktigaste. Även om vi alla har hört frasen "skräp in, skräp ut", är det viktigt att komma ihåg att det inte finns någon perfekt datauppsättning. Detta är bra så länge vi bekvämt kan anta att urvalsdata är representativa för hela populationen. Det finns tre huvudkällor för fastighetsdata:

Den första och ofta bästa datakällan kommer från statliga myndigheter. Mycket av denna data är antingen gratis eller relativt låg kostnad. Många företag tar betalt för data som du enkelt kan få gratis, så ta alltid en snabb titt på internet innan du köper data. En webbsökning ger ofta resultat genom att söka efter det län eller ort du söker efter och ord som "skatteman", "skattevärderingar", "fastighetsbokföring" eller "handlingssökning". Geografiska informationssystem (GIS) avdelningar är en av de mest förbisedda delarna av många samhällen. De har ofta mycket av informationen samlad från olika andra lokala myndigheter. Som fastighetsutvecklare förlitade jag mig ofta på deras hjälp för att hitta högkvalitativ data som jag använde för att bygga modeller för att hjälpa till att hitta nya fastigheter för utveckling. Organisationer för ekonomisk utveckling kan också vara en utmärkt datakälla.
Försäljare med vinstsyfte är ett annat alternativ. De är särskilt användbara när du letar efter data över flera områden. Se till att du gör dina läxor innan du betalar stora summor pengar för deras data. Lita inte bara på deras exempeldatauppsättningar, eftersom det kan vara missvisande när det gäller fullständighet. Om du är osäker på vilken data de har tillgänglig, kontakta en representant direkt eller fråga om en pengarna-tillbaka-garanti.
Slutligen är lokala MLS (Multiple Listing Services) en ovärderlig resurs. De flesta fastigheter marknadsförs genom en fastighetsmäklare som är medlem i en MLS. I allmänhet måste medlemmar i en MLS lägga in alla sina listor i det lokala systemet. Tyvärr finns det ofta många begränsningar för att gå med i en MLS, och kostnaden för dataåtkomst kan vara ganska hög. Det är också viktigt att se till att du inte bryter mot användarvillkoren när du använder deras data och öppnar dig för potentiellt ansvar.

Vi kommer exklusivt att använda gratis data för vårt exempel, hämtad från Western Pennsylvania Regional Data Center och U.S. Census Bureau. Data från Alleghany Real Estate Sales kommer att ge oss en basfil för våra observationer med försäljningspriset som vår beroende variabel (Y-variabel). Vi kommer också att testa variabler med hjälp av gångpoängen för varje folkräkning och skattebedömningsinformation.

En mycket användbar variabel att ha när man bygger fastighetsmodeller är latitud och longitud för varje adress. Du kan få dessa data genom en geokoder som använder en gatuadress för att tilldela en latitud och longitud. U.S. Census Bureau geokoder kommer också att identifiera folkräkningssystemet för varje plats som vanligtvis används för att samla demografisk och psykografisk information.

Analysera, transformera och skapa nya variabler.

Nu när vi har valt våra datakällor måste vi undersöka kvaliteten på datan. Det enklaste sättet att kontrollera datakvaliteten är att köra en frekvenstabell för några nyckelvariabler. Om det finns ett betydande antal saknade eller korrupta poster måste vi undersöka uppgifterna ytterligare. Tabellen nedan visar att endast 1 av 216 498 poster saknar postnummer i försäljningsfilen, och det finns inga felaktiga postnummer som 99999 eller 1X#45. Detta indikerar troligen att detta är en datauppsättning av hög kvalitet.

En dataordbok är en utmärkt resurs när den är tillgänglig. Det kommer att ge en beskrivning av vad varje variabel mäter och möjliga alternativ för variabeln. Vår data innehåller en analys av varje utförd försäljning i länet. Detta är nyckelinformation, särskilt när man arbetar med råa handlingsprotokoll. Alla fastighetstransaktioner måste registreras för att vara verkställbara enligt lag, men inte alla överföringar återspeglar det verkliga marknadsvärdet för en fastighet. Till exempel kan en försäljning mellan två familjemedlemmar ske till ett lägre pris än marknadspriset som en form av en gåva eller för att slippa betala högre transaktionskostnader som stämplar. Lyckligtvis för oss markerar den lokala regeringen tydligt överföringar som de anser inte vara representativa för nuvarande marknadsvärden, så vi kommer bara att använda register som visar en "giltig försäljning". Dessa försäljningar står för endast cirka 18 % av det totala antalet transaktioner, vilket illustrerar hur viktigt det är att förstå din data innan du börjar använda den för analys. Baserat på min erfarenhet är detta förhållande ganska vanligt när man analyserar handlingsprotokoll. Det är mycket troligt att om vi byggde en modell som inkluderar "ogiltig försäljning" skulle våra slutresultat förvrängas.

Därefter kommer vi att lägga till våra bedömningsdata och vandringspoäng till försäljningsfilen. Detta ger oss ett enda bord att använda för vår modell. Vid denna tidpunkt måste vi analysera variablerna för att se om de är lämpliga för linjär regression. Nedan finns en tabell som visar olika typer av variabler.

Vår fil innehåller flera nominella värden som grannskap eller postnummer, som kategoriserar data utan ordningssinne. Nominella värden är olämpliga för linjär regression utan transformation. Det finns också flera ordningsvariabler som graderar byggkvaliteten, fastighetens nuvarande skick etc. Användningen av ordningsdata är endast lämplig när vi rimligen kan anta att varje rang är jämnt fördelad. Till exempel har vår data en betygsvariabel med 19 olika klassificeringar (A+, A, A-, etc.), så vi kan säkert anta att dessa betyg sannolikt är jämnt fördelade.

Det finns också flera variabler som behöver transformeras innan vi kan använda dem i modellen. Ett nominellt värde som kan omvandlas till en dummyvariabel för testning är värme- och kylningsvariabeln. Vi kommer att sätta variabeln till 0 för alla fastigheter utan luftkonditionering och de med luftkonditionering till 1. Bokstavsbetygen måste också omvandlas till siffror (t.ex. 0=Sämst, 1=Bättre, 2=Bäst) för att se om det finns ett linjärt samband med priset.

Slutligen måste vi avgöra om det är lämpligt att använda alla observationer. Vi vill förutsäga värdet på enfamiljshus, så att vi kan eliminera alla kommersiella fastigheter, lägenheter och radhus från data. Vi vill också undvika potentiella problem med autokorrelation, så vi använder endast data för försäljning under 2017 för att begränsa sannolikheten att detta inträffar. När vi har eliminerat alla ovidkommande poster har vi vår slutliga datauppsättning som ska testas.

Exempel och variabelval

Att välja rätt provstorlek kan vara svårt. Bland akademiskt material finns ett brett utbud av minimala siffror som föreslås och olika tumregler. För vår studie är den totala populationen ganska stor, så vi behöver inte oroa oss för att ha tillräckligt för ett urval. Istället riskerar vi att ha ett urval så stort att nästan varje variabel får en statistisk signifikans i modellen. Till slut valdes cirka 10 % av posterna ut slumpmässigt för modellering.

Variabelt urval kan vara en av de svåraste delarna av processen utan statistisk programvara. Men SPSS tillåter oss att snabbt bygga många modeller från en kombination av variabler som vi har ansett lämpliga för en linjär regression. SPSS kommer automatiskt att filtrera bort variabler baserat på våra trösklar för statistisk signifikans och endast returnera de bästa modellerna.

Bygga modellen och granska resultaten

Från våra exempeldata tog SPSS fram fem modeller. Den modell som var mest prediktiv inkluderade följande 5 variabler.

Betyg baserat på konstruktionens kvalitet rankad 1-19 (1=Mycket dålig och 19=Utmärkt)
Färdigt vardagsrum
Luftkonditionering (Ja/Nej)
Loggstorlek
Betyg för fysisk kondition eller reparationsskick rankad 1-8 (1=obeboelig och 8=utmärkt)

Låt oss ta en titt på resultaten från SPSS. Vårt huvudfokus kommer initialt att ligga på det R-kvadratvärde värdet som talar om för oss hur stor procentandel av variansen i den beroende variabeln (priset) som förutsägs av regressionen. Bästa möjliga värde skulle vara 1, och resultatet av vår modell är ganska lovande. Standardfelet för skattningen som mäter modellens precision ser ut att vara ganska hög på 73 091 $. Men om vi jämför det med standardavvikelsen för försäljningspriset i modellen ($160 429), verkar felet rimligt.

Modell 5 hade ett acceptabelt standardfel och klarar Durbin-Watson-testet

SPSS har inbyggd funktionalitet för att testa för autokorrelation med Durbin-Watson Test. Helst skulle värdet vara 2,0 på en skala från 0 till 4, men ett värde på 1,652 bör inte orsaka larm.

Därefter testar vi resultaten av modellen för att avgöra om det finns några bevis på heteroskedasticitet. Det finns ingen inbyggd funktionalitet för SPSS, men med detta makro skrivet av Ahmad Daryanto kan vi använda Breusch-Pagan och Koenker-testerna. Dessa tester visar att det finns heteroskedasticitet i vår modell eftersom signifikansnivån (Sig) i diagrammet nedan är under 0,005. Vår modell har brutit mot ett av de klassiska antagandena om linjär regression. Troligtvis behöver en av variablerna i modellen transformeras för att eliminera problemet. Men innan vi gör detta är det en bra idé att se vilka effekterna av heteroskedasticiteten har på prediktiva kraften hos våra oberoende variabler. Genom att använda ett makro utvecklat av Andrew F. Hayes kan vi titta på de justerade standardfelen och signifikansnivåerna för våra oberoende variabler.

Det finns heteroskedasticitet i modellen, men ytterligare tester visar att det inte påverkar de oberoende variablerna

Ytterligare tester avslöjar att de oberoende variablerna förblir statistiskt signifikanta, efter att ha tagit hänsyn till heteroskedasticiteten i modellen, så vi behöver inte nödvändigtvis ändra den för nu.

Testa och förfina modellen

Som ett sista test kommer vi att poängsätta alla försäljningsrekord som inte var en del av det ursprungliga provet med vår modell. Detta kommer att hjälpa oss att se hur modellen presterar på en större uppsättning data. Resultaten av detta test visar att det R-kvadratvärde värdet och standardfelet för uppskattningen inte förändrades nämnvärt på den stora datamängden, vilket sannolikt indikerar att vår modell kommer att fungera som förväntat.

Att tillämpa modellen på hela datasetet visar överensstämmelse med provet, med liknande R-kvadrat- och standardfelvärden observerade

Om vi ville använda vår exempelmodell i verkligheten, skulle vi sannolikt ytterligare segmentera data för att ha flera modeller som var mer exakta eller leta efter ytterligare data för att förbättra precisionen för denna enstaka modell. Dessa steg skulle också sannolikt ta bort den heteroskedasticitet vi såg närvarande i modellen. Baserat på det faktum att vi försökte använda en enda modell för att förutsäga värdet på hus i ett län med över 1 miljon människor, borde det inte vara någon överraskning att vi inte kunde bygga den "perfekta" modellen på bara ett par timmar .

Slutsatser

Vårt mål var att bygga en modell som förutsäger värdet på småhus. Vår analys visar att vi uppnådde det målet med en rimlig grad av precision, men är vår modell vettig?

Om vi skulle beskriva vår modell skulle vi säga att värdet på ett hus är beroende av tomtens storlek, husets kvadratmeter, kvaliteten på konstruktionen, det aktuella reparationsläget och om det har eller inte luftkonditionering. Detta verkar mycket rimligt. Faktum är att om vi jämför vår modell med de traditionella värderingsmetoderna ser vi att den är väldigt lik kostnadsmetoden, som lägger till kostnaden för att förvärva mark och bygga en ny byggnad justerad för det nuvarande inkuransläget. Men denna likhet kan vara, för att använda en regressionsfras, en falsk korrelation.

Normalt är kostnadsmetoden endast rekommenderas för värdering av nyare fastigheter, på grund av problem med att bestämma lämplig metod för avskrivning av äldre fastigheter. Med vår modell har vi skapat en liknande strategi som är användbar för fastigheter i alla åldrar, i själva verket har vi testat ålder som en oberoende variabel och kommit fram till att den inte har någon statistiskt signifikant inverkan på fastighetsvärdet!

Använda regressionsanalys för ditt företag

Förhoppningsvis har du vid det här laget en bättre förståelse för grunderna i regressionsanalys. Nästa fråga är:kan det hjälpa ditt företag? Om du svarar ja på någon av dessa frågor kan du förmodligen ha nytta av att använda regressionsanalys som ett verktyg.

Vill du ha ett mer vetenskapligt tillvägagångssätt för att bestämma värde, göra prognoser eller analysera en viss marknad?
Letar du efter bättre sätt att identifiera potentiella fastighetsinvesteringar över stora områden, regioner eller till och med rikstäckande?
Är ditt mål att attrahera stora återförsäljare, restauranger eller besöksföretag för ditt kommersiella fastighetsprojekt?
Tror du att du potentiellt skulle kunna förbättra din beslutsprocess genom att införliva nya datapunkter i processen?
Är du bekymrad över avkastningen på din investering i marknadsföring för köpare och investerare?

Exempelmodellen ovan är en enkel demonstration av värdet av att använda regressionsmodellering i fastigheter. De 2-3 timmar det tog att samla in data och bygga modellen är långt ifrån att visa sin fulla potential. I praktiken finns det en mängd olika användningsområden för regressionsanalys i fastighetsbranschen utöver fastighetsvärdering inklusive:

Prisanalys för listpriser och hyrespriser
Demografisk och psykografisk analys av bostadsköpare och hyresgäster.
Identifiera mål för direktmarknadsföring
ROI-analys för marknadsföringskampanjer

Geospatial modellering använder principerna för regressionsanalys parat med de tre viktigaste sakerna inom fastigheter:läge, läge, läge. Genom att arbeta som bostadsutvecklare i åtta år kan jag intyga kraften i geospatial modellering. Med ArcGIS kunde jag infoga försäljningsdata, paketkartor och lidardata för att hitta egenskaper som var idealiska för utveckling i bergen i North Carolina.

Baserat på min erfarenhet, görs det mesta av pengarna i fastigheter i förvärvet inte utvecklingen av ett projekt. Att kunna identifiera möjligheter som andra missar kan vara en enorm konkurrensfördel inom fastigheter. Geospatial analys är något stora företag har utnyttjat i många år, men mindre företag förbiser ofta.

Hur du identifierar rätt analyspartner för ditt företag

Väldigt få människor skulle betygsätta statistik som sitt favoritämne. Faktum är att människor som helhet är väldigt dåliga på att förstå ens grundläggande sannolikheter. If you’re doubtful of this opinion, take a trip to Las Vegas or Macau. Unfortunately, this can make it difficult to determine who to trust when you’re looking for advice on implementing regression analysis in your process. Here are some key things to look for when evaluating potential candidates

While people are bad at judging probabilities, intuition is actually rather good at detecting lies. You should be very skeptical of anyone who claims to be able to build a model that will answer all your questions! Don’t trust a guarantee of results. Hopefully, this article has illustrated the fact that regression analysis is based on empirical observation and sound science. It will always be the case that certain things are easier to predict than others. A trusted advisor will be open and honest when they can’t find the answers you’re looking for, and they won’t run through your budget trying to find one that isn’t there.

Look for Mr. Spock instead of Captain Kirk. Sound research can be an excellent marketing tool, but far too often people pay for sexy marketing materials with a whiff of pseudo-research and no logic to back it up. Some people are naturally more analytical, but great analytical skills come from practice. Ideally, anyone you hire to analyze data for your business will have experience finding solutions to a wide variety of problems. Someone with a narrow focus may be more susceptible to groupthink, especially when their experiences closely mirror your own.

Put potential candidates on the spot with questions that help demonstrate their reasoning abilities. This is not the time to rely on behavioral questions alone. Ideal candidates will have the ability to strategically use known information to reasonably estimate the answer to complex problems. Ask logical reasoning questions, like “How many tennis balls could you fit in the Empire State Building?”

Finally, you should look for someone with whom you can communicate. All of the information in the world won’t help if you can’t put it to good use. If someone uses so much jargon in an introductory conversation that your eyes start to glaze over, then they probably aren’t the right fit for your company.

För grundare som skaffar kapital:Tänk igenom konsekvenserna av konvertibla sedlar Taktik och strategier för M&A-förhandling:Tips från ett proffs

Företagsfinansiering